Bug 488

Summary: 句子中部分符号无法正确过滤,导致单词拆分时出错
Product: EnglishPal Reporter: 章翊 <2422435987>
Component: Bug报告Assignee: Hui Lan <lanhui>
Status: CONFIRMED ---    
Severity: enhancement    
Priority: ---    
Version: 0.1   
Hardware: PC   
OS: Windows   

Description 章翊 2022-10-18 17:57:16 CST
在使用过程中发现,部分符号无法被正确分割。

1.句子中单词末尾存在英文引号符号(")时,单词会被分隔为原单词+&。
  如text" 会被视作text& 作为一个生词出现。 注:中文引号(“”) 不会出现此现象。

2.句子中单词末尾存在中文省略符号(...)以及中文分号(;)时,单词不会被正确分隔
  如text... 会被视作text...作为一个生词出现,
    text; 会被视作text;作为一个生词出现。
Comment 1 Hui Lan 2023-11-16 20:04:57 CST
收集生词时,应不仅判断生词开头是否为英文,还要判断生词中间是否包含中文,避免将中文生词加入到生词簿里,如“sun光”会加入其中,而“光”却不会加入其中

-章师锴
Comment 2 Hui Lan 2023-11-16 20:25:40 CST
在一个单词后面紧跟上中文标点符号,中文标点符号不会被删除,如输入orange。查询到的生词也是orange。

-林杉