[分享] 用剑桥在线词典拉了个 Anki 雅思单词牌组 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
InsideSeed
V2EX    雅思

[分享] 用剑桥在线词典拉了个 Anki 雅思单词牌组

  •  1
     
  •   InsideSeed 2023-08-04 14:18:03 +08:00 4293 次点击
    这是一个创建于 798 天前的主题,其中的信息可能已经有所发展或是发生改变。

    正题

    因为剑桥在线词典的查询页面排版本身已经足够优秀(特别是英英释义用到的单词都很简单明了,我觉得这点是比其他词典好的地方),直接拉 HTML 下来做成 Anki 卡片就好了。

    有用 Anki 的朋友可以直接下载.apkg包导入就好了,样式在common.css里,复制粘到你卡片模板设置里面就好了,用过 Anki 的应该都知道。

    具体直接看这里

    示例

    以经典的abandon为例:

    正面

    front

    背面

    back

    其他工具

    另外不知道用 Anki 的朋友是不是都知道老黄的 ODH (在线词典助手),搜索引擎直接搜就可以找到这款浏览器插件,配合 Anki 制卡效果极佳,推荐。

    15 条回复    2023-09-20 20:45:22 +08:00
    InsideSeed
        1
    InsideSeed  
    OP
       2023-08-04 14:22:20 +08:00
    可能有人觉得直接把词典页面作为卡片是不是内容太多了,但我感觉其实剑桥的内容刚刚好,如果你背单词只是正面英文反面中文释义加几个例句的话,其实是训练自己对英文到中文的映射关系,最好还是按照一词多义分开稍微多加一些语料。不用太多,不用太少。
    InsideSeed
        2
    InsideSeed  
    OP
       2023-08-04 14:26:22 +08:00
    最近有一些 AI 口语练习的语言学习插件,我暂时还没有试过,有试过的朋友可以分享一下使用体验。
    如果效果可用的话,绝对是省钱高效。(毕竟雅思口语一对一价格大家都懂
    Noicdi
        3
    Noicdi  
       2023-08-04 17:33:17 +08:00 via iPhone
    请问点击单词或者音标,然后支持发音吗?以前一直有这个想法但是不会搞
    InsideSeed
        4
    InsideSeed  
    OP
       2023-08-04 20:04:23 +08:00
    @Noicdi 之前没有拉音频文件,我把无关的 dom 节点都删掉之后拉的 HTML 。等我有空看看 anki 卡片怎么链接多媒体文件的,应该可以加上
    InsideSeed
        5
    InsideSeed  
    OP
       2023-08-04 20:09:24 +08:00
    @Noicdi 其实就是个调 api 的脏活,你只要用你会的语言现有的爬虫库(能够获取页面 DOM 节点并按照你的需要裁剪)把你要的内容拉下来,以某种结构化的形式保存或者做进一步操作就可以了
    InsideSeed
        6
    InsideSeed  
    OP
       2023-08-04 20:22:48 +08:00
    路过的 v 友萌如果对你有帮助的话,记得点个小啊
    acerphoenix
        7
    acerphoenix  
       2023-08-04 22:04:10 +08:00
    正准备写个类似功能呢,刚用麦克米伦 7000 词过滤出了近 2000 的生词准备做 anki 。想找个查词接口批量查释义再导入 anki
    InsideSeed
        8
    InsideSeed  
    OP
       2023-08-04 22:25:58 +08:00
    @acerphoenix 哈哈哈,握个手。其实 github 上可用的词典接口还是有一些的。另外你也可以用 mdx-server 类似的工具把本地的 mdx 包装成接口使用,我前几天翻的时候看到的
    Noicdi
        9
    Noicdi  
       2023-08-04 22:45:46 +08:00
    @InsideSeed #5 之前我的考虑就是通过模板的形式把单词的正反面格式确定下来,发音的话就通过网易有道词典或者啥提供的 API 链接来。这个脚本就可以以一个单词作为参数,把具体的内容填充到模板的对应位置,形成一张卡片。然后导出欧陆词典的生词本,调用脚本形成一批生词的 anki 卡片来背。
    Noicdi
        10
    Noicdi  
       2023-08-04 22:47:56 +08:00
    InsideSeed #5 但是后面考虑到不熟悉脚本类语言,anki 也没有接触过,不会写模板,觉得没必要搞那么麻烦应该直接开始背单词,就单纯搞了解析欧陆词典生词本的脚本,需要的时候手动导出一次生词放在墨墨背单词里直接用了。
    InsideSeed
        11
    InsideSeed  
    OP
       2023-08-04 23:25:33 +08:00   1
    @Noicdi 你说的思路当然是对的。

    直接背单词肯定没毛病,主要是 anki 并不只是个背单词的软件,闪卡拿来干嘛都行。

    墨墨背单词的强项是间隔算法 fsrs (算法作者也是 anki 推行者,因此 anki 也可以配置同样的算法),墨墨的释义我觉得是普通水平,英英释义还是得靠别的词典资源。

    Anyway ,背单词才是第一要务。

    关于卡片模板,我就是想偷懒所以才直接用的 HTML 和原网页的 CSS ,只要往正反面填进去就行了,简单无脑。我只加了一个 Word 字段来作为排序列。
    欧陆生词本用 Dict2Anki 这个插件可以直接导入卡片和语音(语音有 bug 要修一下),但它的缺点就是释义真的有点拉,我是特别看重英英释义的,但它的英文释义我不知道从哪扒下来的,都是用生词解释生词。而且多义也不行。那个项目已经好久没维护了,作者处于弃疗状态,也不容易。如果有人擅长 QT 和 Python 且愿意的话去维护这个插件项目也是一件很有价值的事情。
    arischow
        12
    arischow  
       2023-08-05 17:34:52 +08:00 via iPhone
    op 你和我最近在做的事情很像!只不过我是把 OALD 的导入到 RemNote
    InsideSeed
        13
    InsideSeed  
    OP
       2023-08-06 14:37:58 +08:00
    @arischow 自己动手丰衣足食
    VictorFrank1
        14
    VictorFrank1  
       2023-09-18 22:41:29 +08:00
    感谢楼主的无私分享。我从年初开始用 anki 背单词(随手下了个托福词库,不知道和雅思区别大吗?)到现在显示我已经背了 8000+单词了,但我感觉我还是好多单词记不住或者忘了,我现在有点开始怀疑算法了,比如某个单词当时背的很熟练,然后我选择了 Easy 1 年后再复习,但我很可能 3 月又忘了,然后陷入循环... 另外 感觉 Anki 复习的压力特别大,我最高的记录一天 Reviewed 1000 次,这两天试了下传统的手机 App 背单词,发现复习压力好像小很多,不知道哪个算法好了(哭
    InsideSeed
        15
    InsideSeed  
    OP
       2023-09-20 20:45:22 +08:00   1
    @VictorFrank1 谢谢支持( ps: 之前#3 楼提到的发音我也加上去了

    关于 Anki 的间隔算法,可以看看这位某乎答主: https://www.zhihu.com/people/L.M.Sherlock

    墨墨背单词的间隔算法是他负责的,他之前有提交一个 FSRS 算法对应的 js 实现在他的 github 上,

    以及这个回答: Anki 牌组参数该怎样设置,不会产生太多的刷卡压力 https://www.zhihu.com/question/465450224/answer/1945096976

    不妨试一试。
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     917 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 25ms UTC 19:57 PVG 03:57 LAX 12:57 JFK 15:57
    Do have faith in what you're doing.
    ubao snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86