在使用过程中发现,部分符号无法被正确分割。 1.句子中单词末尾存在英文引号符号(")时,单词会被分隔为原单词+&。 如text" 会被视作text& 作为一个生词出现。 注:中文引号(“”) 不会出现此现象。 2.句子中单词末尾存在中文省略符号(...)以及中文分号(;)时,单词不会被正确分隔 如text... 会被视作text...作为一个生词出现, text; 会被视作text;作为一个生词出现。
收集生词时,应不仅判断生词开头是否为英文,还要判断生词中间是否包含中文,避免将中文生词加入到生词簿里,如“sun光”会加入其中,而“光”却不会加入其中 -章师锴
在一个单词后面紧跟上中文标点符号,中文标点符号不会被删除,如输入orange。查询到的生词也是orange。 -林杉