Commit Graph

9 Commits (6bd9fe9778f3be68c0382a58d0a05550979e8af9)

Author SHA1 Message Date
俞黄焘 a83f91a88d 1、添加误删的IELTS单词标签
2、简化评级流程(快很多,几乎与网站相同)
3、删除了原先用于提取词根的函数
2023-05-18 20:36:31 +08:00
俞黄焘 c4378e73cd 1、删除了difficulty_level_from_frequency
2、修改了get_difficulty_level_for_user,按新的方式修改了单词的评级方式:CET4 等于 level 4, OXFORD3000 等于 level 5, CET6 等于 level 6, GRADUATE 等于 level 6, OXFORD5000 等于 level 7, BBC 等于 level 8,找不到等于 level 3
2023-05-18 16:59:30 +08:00
俞黄焘 fc515a7b08 三改 2023-05-16 19:02:16 +08:00
俞黄焘 541f78c7ea 评审后的修改(words_and_tests.p文件没有提交,为防止版本的控制) 2023-05-15 09:58:32 +08:00
俞黄焘 ddbce62089 1、重新对difficulty中部分函数名和变量名进行了修改,便于理解
2、对原先的词库进行了修改,原先apple和apples等词被错误收录在BBC级别里,被评为8级,现词库采用了近4500个四级词汇、2000个六级词汇、5000个考研词汇、4000个雅思词汇,此处共计7600个左右,有许多词同时具有2/3/4个标签,此外还有近九万个包括但不限于地名、人名、心理或医学等方面的词汇,比较少见,暂定等级为7
2023-05-11 21:32:08 +08:00
俞黄焘 a39b0bb8e5 新建了simplify_the_words_dict函数专门用于给评级后的词库单词清洗词根,词根的难度按照其变式的最低等级决定, 2023-05-10 13:35:44 +08:00
俞黄焘 ce9e18e3fe 新建了get_difficulty_level_for_words_and_tests函数专门用于给词库单词评级,返回得到一个字典d2({'apple': 4, 'banana': 4, ...});修改get_difficulty_level函数,给用户的单词评级, 分三种情况:1.以原型出现,则无需操作,因为已经出现在d2;2.词根与词库中某单词词根相同,视为一个难度的单词;3.以上两种情况之外的词视为不在词库中的词,按照difficulty_level_from_frequency函数方法评定难度。
目前还未进行测试。
2023-05-10 00:58:12 +08:00
Lan Hui 5e322f067b requirements.txt includes dependencies of the program. difficulty.py is modified in this fix. Not sure why build.sh is included. 2021-08-20 19:27:44 +08:00
Hui Lan 843ed03d4f Publish EnglishPal source code 2021-04-06 16:22:03 +08:00