有无方法将一份 word 题库转成这种格式的 txt - V2EX
StefanShenHSC

有无方法将一份 word 题库转成这种格式的 txt

  •  
  •   StefanShenHSC Dec 7, 2022 1647 views
    This topic created in 1267 days ago, the information mentioned may be changed or developed.
    word 原文:

    275. A 15-year-old girl got pain throat and dry cough for one week, with fever. The high temperature is 38.5 centigrade. Thechest X-ray film showed ground-glass shadow in the middle and lower zones of the right lung. Which kind of antibiotic should be choose
    A . macrolide
    B . penicillin
    C . fluoroquilonone (氟喹诺酮)
    D . cephlosporine
    E . aminoglycoside (氨基糖苷)
    考生答案:
    参考答案:A

    目标 txt 格式:

    A 15-year-old girl got pain throat and dry cough for one week, with fever. The high temperature is 38.5 centigrade. Thechest X-ray film showed ground-glass shadow in the middle and lower zones of the right lung. Which kind of antibiotic should be choose<br>A . macrolide <br>B . penicillin <br>C . fluoroquilonone <br>D . cephlosporine <br>E . aminoglycoside;参考答案:A

    i.e. 题目和五个选项用<br>隔开在同一行,参考答案通过";"分割
    题库就是很多这种格式的题,想把他转化成这种格式的 txt 导入到 anki 里
    题主没太有编程经验,求大神来点详细的教程
    11 replies    2022-12-09 14:03:49 +08:00
    imaple
        1
    imaple  
       Dec 7, 2022
    看着用查找->替换就能解决了,文件很大吗?
    StefanShenHSC
        2
    StefanShenHSC  
    OP
       Dec 7, 2022
    @imaple 就是有几百道题,一道一道是挨着的,我理解查找-替换的方法是,找换行符号然后替换成<br>,但是两道题之间的换行这样就没了?目标 txt 是每行一道题+答案
    StefanShenHSC
        3
    StefanShenHSC  
    OP
       Dec 7, 2022
    @imaple

    274. 女性,46 岁。反复胸闷、咳嗽 3 年,再发 1 周。既往体健。查体:T 36.5℃,P 96 次 /分,R 26 次 /分,BP 105/70mmHg 。双肺呼吸音低,未闻及干湿性音。最有助于确诊患者“支气管哮喘”的辅助检查结果是
    A .痰嗜酸粒细胞增高
    B .血嗜酸粒细胞增高
    C . FeNO (呼出气冷凝液 NO )增高
    D .血 IgE 增高
    E . PEF 日间变异率≥20%
    考生答案:
    参考答案:E
    得分:0 分 (此题满分:01 分)

    275. A 15-year-old girl got pain throat and dry cough for one week, with fever. The high temperature is 38.5 centigrade. Thechest X-ray film showed ground-glass shadow in the middle and lower zones of the right lung. Which kind of antibiotic should be choose
    A . macrolide
    B . penicillin
    C . fluoroquilonone (氟喹诺酮)
    D . cephlosporine
    E . aminoglycoside (氨基糖苷)
    考生答案:
    参考答案:A
    得分:0 分 (此题满分:01 分)

    文档格式大概是这样
    imaple
        4
    imaple  
       Dec 7, 2022   1
    @StefanShenHSC 看着两道题之间是 2 个换行,另外两道题之间的换行夹带着数字。这些都是可以用来区分题目和选项的换行点
    singerll
        5
    singerll  
       Dec 7, 2022   1
    再把“分)”替换成“分)”+换行,不就行了。或者把“数字.”替换成换行+“数字.”
    killva4624
        6
    killva4624  
       Dec 7, 2022   1
    复制到一个 TXT 里,用正则替换就好,我干过类似的事情
    题目正文: ^\d{1,}\.(.*)\n 替换成 \1<br>
    选项: ^([A-Z] \..*)\n 替换成 \1<br>
    不要的行正则去掉: 考生答案.*\n 替换成空
    StefanShenHSC
        7
    StefanShenHSC  
    OP
       Dec 7, 2022
    谢谢兄弟们,你们是我的神!

    不过遇到了新问题,这里有 A4 型和 B1 型题

    A4 型是一个题干跟两~三道题 B1 型是一套答案跟两道题

    A4 例子:
    637-639 题共用题干:
    男,39 岁。剧烈活动时胸部闷痛 4 年。2 天来活动时多次发生短暂意识丧失,数分钟后意识恢复。查体:BP 110/60mmHg ,心界不大,心率 88 次 /分,心律齐,胸骨左缘第四肋间可闻及 3/6 级收缩期喷射性杂音。
    637. 该患者最可能的诊断是
    A .急性心肌梗死
    B .风湿性心脏病
    C .肥厚型梗阻性心肌病
    D .扩张型心肌病
    E .房间隔缺损
    考生答案:
    参考答案:C
    得分:0 分 (此题满分:01 分)
    638. [假设信息]该患者 1 天来反复黑,伴晕厥 1 次,休息时心电图正常。为进一步明确晕厥的原因,首选的检查是
    A .心脏电生理检查
    B . Holter
    C .脑电图
    D .脑 CT
    E .超声心动图
    考生答案:
    参考答案:E
    得分:0 分 (此题满分:01 分)
    639. 该患者首选的治疗药物是
    A .地尔硫
    B .美托洛尔
    C .培哚普利
    D .地高辛
    E .华法林

    B1 例子:
    640-641 题共用备选答案:
    A .异烟肼
    B .利福平
    C .链霉素
    D .吡嗪酰胺
    E .乙胺丁醇
    640. 对于快速生长的结核菌( A 群)作用最强的药物是
    考生答案:
    参考答案:A
    得分:0 分 (此题满分:01 分)
    641. 对半休眠但偶尔短期内旺盛生长的结核菌( C 群)最用效的药物是
    考生答案:
    参考答案:B
    得分:0 分 (此题满分:01 分)

    这两种好像替换解决不了,哭泣
    registerrr
        8
    registerrr  
       Dec 7, 2022   1
    @StefanShenHSC
    没什么替换不了的,自己大概摸索一下原理,修改一下正则匹配规则
    B1 型题目用 “共用备选答案:” 这几个关键字当锚点
    A4 型题目用 “共用题干” 这几个关键字当锚点

    一轮不行,多来两轮
    StefanShenHSC
        9
    StefanShenHSC  
    OP
       Dec 7, 2022
    @registerrr 好的谢谢!我研究研究
    kome
        10
    kome  
       Dec 7, 2022   1
    引号内为替换 /被替换内容。
    "^pA."替换成"<br>A.",其他选项类似。
    "^p 考生答案:"替换成";"。
    "^p 参考答案:"替换成参考答案:"参考答案:"。
    "考生得分*^p"替换成"^p"。

    大概就是上面几个替换,先 word 复制出来一部分内容试试看,确定没问题了就全部替换,大不了最后审查一遍。
    这类文档规律性很强,找找固定格式,配合 word 通配符批量替换就是了。
    StefanShenHSC
        11
    StefanShenHSC  
    OP
       Dec 9, 2022 via iPhone
    update 一下,我找到了 B1 A4 题如何把每道题的题目和答案分别聚集在一起的方法,可以找到锚点之后替换成英文逗号,然后转成 ansi 编码的 csv 文件,就可以在 excel 里直接更改顺序啦!改完了再转成 utf-8 就行
    About     Help     Advertise     Blog     API     FAQ     Solana     3150 Online   Highest 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 67ms UTC 13:41 PVG 21:41 LAX 06:41 JFK 09:41
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86