Commit Graph

6 Commits (541f78c7eabcaade6f6393ab584dd30f1f1b0833)

Author SHA1 Message Date
俞黄焘 541f78c7ea 评审后的修改(words_and_tests.p文件没有提交,为防止版本的控制) 2023-05-15 09:58:32 +08:00
俞黄焘 ddbce62089 1、重新对difficulty中部分函数名和变量名进行了修改,便于理解
2、对原先的词库进行了修改,原先apple和apples等词被错误收录在BBC级别里,被评为8级,现词库采用了近4500个四级词汇、2000个六级词汇、5000个考研词汇、4000个雅思词汇,此处共计7600个左右,有许多词同时具有2/3/4个标签,此外还有近九万个包括但不限于地名、人名、心理或医学等方面的词汇,比较少见,暂定等级为7
2023-05-11 21:32:08 +08:00
俞黄焘 a39b0bb8e5 新建了simplify_the_words_dict函数专门用于给评级后的词库单词清洗词根,词根的难度按照其变式的最低等级决定, 2023-05-10 13:35:44 +08:00
俞黄焘 ce9e18e3fe 新建了get_difficulty_level_for_words_and_tests函数专门用于给词库单词评级,返回得到一个字典d2({'apple': 4, 'banana': 4, ...});修改get_difficulty_level函数,给用户的单词评级, 分三种情况:1.以原型出现,则无需操作,因为已经出现在d2;2.词根与词库中某单词词根相同,视为一个难度的单词;3.以上两种情况之外的词视为不在词库中的词,按照difficulty_level_from_frequency函数方法评定难度。
目前还未进行测试。
2023-05-10 00:58:12 +08:00
Lan Hui 5e322f067b requirements.txt includes dependencies of the program. difficulty.py is modified in this fix. Not sure why build.sh is included. 2021-08-20 19:27:44 +08:00
Hui Lan 843ed03d4f Publish EnglishPal source code 2021-04-06 16:22:03 +08:00