Bug 488 - 句子中部分符号无法正确过滤,导致单词拆分时出错
Summary: 句子中部分符号无法正确过滤,导致单词拆分时出错
Status: CONFIRMED
Alias: None
Product: EnglishPal
Classification: Unclassified
Component: Bug报告 (show other bugs)
Version: 0.1
Hardware: PC Windows
: --- enhancement
Assignee: Hui Lan
URL:
Depends on:
Blocks:
 
Reported: 2022-10-18 17:57 CST by 章翊
Modified: 2023-11-16 20:25 CST (History)
0 users

See Also:


Attachments

Description 章翊 2022-10-18 17:57:16 CST
在使用过程中发现,部分符号无法被正确分割。

1.句子中单词末尾存在英文引号符号(")时,单词会被分隔为原单词+&。
  如text" 会被视作text& 作为一个生词出现。 注:中文引号(“”) 不会出现此现象。

2.句子中单词末尾存在中文省略符号(...)以及中文分号(;)时,单词不会被正确分隔
  如text... 会被视作text...作为一个生词出现,
    text; 会被视作text;作为一个生词出现。
Comment 1 Hui Lan 2023-11-16 20:04:57 CST
收集生词时,应不仅判断生词开头是否为英文,还要判断生词中间是否包含中文,避免将中文生词加入到生词簿里,如“sun光”会加入其中,而“光”却不会加入其中

-章师锴
Comment 2 Hui Lan 2023-11-16 20:25:40 CST
在一个单词后面紧跟上中文标点符号,中文标点符号不会被删除,如输入orange。查询到的生词也是orange。

-林杉

Note You need to log in before you can comment on or make changes to this bug.