缘由

在电子词典(程序)的帮助,我们在阅读文档时可以非常快速地查询生词内容。更进一步,借助于专用的阅读工具(目前有非常不成熟的产品如 polar),我们可以直接在阅读时一键制卡,就像之前介绍过的 浏览器查词并一键制成 Anki 卡片 一样方便快捷。

但是无论这个流程有多么流畅快捷,在阅读资料时查生词总是会打断阅读思路,影响阅读效果。今天介绍的插件 Vocabulary Extractor: study difficult words prior to reading a book - AnkiWeb 应运而生。

Vocabulary Extractor

这个插件的作用:

  • Extracts hard english vocabulary words.
  • Creates a vocabulary deck with sentences and definitions.
  • Sentences taken directly from the book.

安装后,在菜单栏 Tools 选项下即可找到该插件。然后即可直接导入需要提取生词的资料。比如,我测试《美国公民读本》(ACIVIC READER FOR YOUNG AMERICAN)一书,设置的 level0 ,该插件将以资料名为牌组名自动生成 201 个生词。

将未读资料中的生词先导入Anki学习-2020-06-23-23-08-07

该插件生成的卡片效果如下:

将未读资料中的生词先导入Anki学习-2020-06-23-23-14-37

在复习所生词的卡片时会能用两个功能:

  • When reviewing cards press J to define the selected word instead.
  • When reviewing cards press H to highlight the current selection. (This is useful when only one definition of a word is relevant.)

这两个功能都非常实用。

目前该插件支持解析下列文档:

  • .txt (preferred)
  • .html
  • .pdf (words and spaces must be selectable)
  • .epub
  • .mobi
  • .fb2

支持的文档类型对我而言完全够用。

不足与改进

该插件总体设计思路非常不错,非常值得学习,但是有两大不足。我希望改进这个插件,不过我目前非常忙,并且也没有写 Anki 插件的经验,所以需要一段时间。

词汇分级偏难

该插件目前的词汇分级偏难,作者举例如下:

Example: Declaration of Independence

  • Level 20: impel, shewn, usurpations, evinces, sufferance, inestimable, perfidy, magnanimity, disavow, consanguinity, acquiesce, rectitude.
  • Level 60: shewn, evinces, perfidy, consanguinity.
  • Level 100: no words.

说实话,例子中的单词我一个都不认识。我随便选了两篇《经济学人》的文章,将难度级别调到最低 0,插件并没有识别到生词。也就是说该插件词汇分级偏难,对于英语水平比较一般的朋友非常不友好。

我计划引入四六级、考研、专四、专八、雅思、托福等等词库,或者按 COCA 词频,或 CEFR 分级等改进生词库。

制卡问题

卡片美不美观尚且不论。该插件将生词所有含义都列入,并且解释过于简洁,这是致命缺陷。

提取出生词后,其实选择逐一查看生词,这时可以列出生词所有义项让用户自己查询语境含义。此外,不知道作者引用什么词典来源,但是效果看来一般。可以用丰富的在线词典提取释义(本地词典的支持比较复杂,后续可能会考虑)

后记

如果你知道更优秀的同类插件或奇技淫巧,欢迎留言推荐。