EnglishPal/app/pickle_idea.py

###########################################################################
# Copyright 2019 (C) Hui Lan <hui.lan@cantab.net>
# Written permission must be obtained from the author for commercial uses.
###########################################################################

"""
  Purpose: dictionary & pickle as a simple means of database.
  Task: incorporate the functions into wordfreqCMD.py such that it will also show cumulative frequency.
"""
import pickle
from datetime import datetime


def lst2dict(lst, d):
    '''
    Store the information in list lst to dictionary d.
    Note: nothing is returned.

    '''
    for x in lst:
        word = x[0]
        freq = x[1]
        if not word in d:
            d[word] = freq
        else:
            d[word] += freq


def dict2lst(d):
    return list(d.items()) # a list of (key, value) pairs


def merge_frequency(lst1, lst2):
    d = {}
    lst2dict(lst1, d)
    lst2dict(lst2, d)
    return d


def load_record(pickle_fname):
    f = open(pickle_fname, 'rb')
    d = pickle.load(f)
    f.close()
    return d


def save_frequency_to_pickle(d, pickle_fname):
    f = open(pickle_fname, 'wb')
    #exclusion_lst = ['one', 'no', 'has', 'had', 'do', 'that', 'have', 'by', 'not', 'but', 'we', 'this', 'my', 'him', 'so', 'or', 'as', 'are', 'it', 'from', 'with', 'be', 'can', 'for', 'an', 'if', 'who', 'whom', 'whose', 'which', 'the', 'to', 'a', 'of', 'and', 'you', 'i', 'he', 'she', 'they', 'me', 'was', 'were', 'is', 'in', 'at', 'on', 'their', 'his', 'her', 's', 'said', 'all', 'did', 'been', 'w']
    exclusion_lst = []
    d2 = {}
    for k in d:
        if not k in exclusion_lst and not k.isnumeric() and len(k) > 1:
            d2[k] = d[k]
    pickle.dump(d2, f)
    f.close()

def unfamiliar(path,word):
    f = open(path,"rb")
    dic = pickle.load(f)
    dic[word] += [datetime.now().strftime('%Y%m%d%H%M')]
    fp = open(path,"wb")
    pickle.dump(dic,fp)

def familiar(path,word):
    f = open(path,"rb")
    dic = pickle.load(f)
    if len(dic[word])>1:
        del dic[word][0]
    else:
        dic.pop(word)
    fp = open(path,"wb")
    pickle.dump(dic,fp)

if __name__ == '__main__':

    lst1 = [('apple',2),  ('banana',1)]
    d = {}
    lst2dict(lst1, d) # d will change
    save_frequency_to_pickle(d, 'frequency.p') # frequency.p is our database


    lst2 = [('banana',2), ('orange', 4)]
    d = load_record('frequency.p')
    lst1 = dict2lst(d)
    d = merge_frequency(lst2, lst1)
    print(d)
Publish EnglishPal source code 2021-04-06 16:22:03 +08:00			`###########################################################################`
			`# Copyright 2019 (C) Hui Lan <hui.lan@cantab.net>`
			`# Written permission must be obtained from the author for commercial uses.`
			`###########################################################################`

Pylint部分： 1. 补充module docstring，即文档顶部的简要说明（我做的说明很简陋，只是为了通过pylint的检查而为之） 2. 优化了if-else-return，即删除了不必要的elif或else 3. 拆分了所有在同一行的模块引用（不同模块的引用需要放在不同行，以便理解和阅读） 4. 删除了部分没有被使用的引用（有的引用在文件A中被使用了，但import却写在了文件B，且文件B没有使用这些引用，而文件A引用了文件B，导致文件B的所有引用也被A引用，这似乎并不合理） 5. 修改了引用的顺序（os、random等系统引用应放在自定义模块引用的上方） 6. 修改了过长的代码，注释除外（每行限制在100个字符以内） 7. 优化了条件判断的判断符号： is和is not 用于判断两个变量是否指向同一个位置 == 和 !=用于比较两个变量 8. 为每个py文件添加了"last new line"，删除了多余的尾部空行 Pylint提示了但是没有进行的操作： 1. 将字符串改为f-string的格式因为f-string需要python3.6以上的版本，为了防止出现版本问题，故不做修改 2. 将所有函数内的return内容改为一致的类型因为原有的代码逻辑已经确定，修改return的类型会导致方法的无法使用，故不做修改 3. 将标识符的格式改为"snake_case naming style" 标识符的修改内容过于庞大，且可能出现程序不可预见的错误，在pylint中重要等级为0，故不做修改 JSLint Part: 1. 提高代码的可读性：将部分超过80个字符的代码行拆解开（由于文字注释的存在，很多语句仅注释就超过了80个字符，此类型的语句行不做修改） 2. 用===与！==代替==与！=的判断 3. 将i++改为i+=1 4. 分离for循环中的let与var到其他行中，以适应JSLint在循环语句中对var和let的偏好 5. 给三元表达式外围添加圆括号，避免出现优先级的问题 6. 将正则表达式修改为JSLint要求的多行模式疑问：形如： for (let i = 0; i < list.length; i+=1) { 的语句，JSLint报错： [JSLint was unable to finish] Unexpected 'let'. 但是网上搜索到的结果是ES6是支持let的使用的，暂且不做修改。 2023-05-26 22:18:11 +08:00			`"""`
			`Purpose: dictionary & pickle as a simple means of database.`
			`Task: incorporate the functions into wordfreqCMD.py such that it will also show cumulative frequency.`
			`"""`
Publish EnglishPal source code 2021-04-06 16:22:03 +08:00			`import pickle`
Update pickle_idea.py 在生词簿每个单词后面，加上两个按钮，熟悉与不熟悉。如果点熟悉，就将生词簿中该单词后面记录的添加次数减一，直至减为0，就将该单词从生词簿中移除；如果点不熟悉，就将生词簿中该单词后面记录的添加次数加一。 2021-05-31 08:48:03 +08:00			`from datetime import datetime`
Publish EnglishPal source code 2021-04-06 16:22:03 +08:00

			`def lst2dict(lst, d):`
Pylint部分： 1. 补充module docstring，即文档顶部的简要说明（我做的说明很简陋，只是为了通过pylint的检查而为之） 2. 优化了if-else-return，即删除了不必要的elif或else 3. 拆分了所有在同一行的模块引用（不同模块的引用需要放在不同行，以便理解和阅读） 4. 删除了部分没有被使用的引用（有的引用在文件A中被使用了，但import却写在了文件B，且文件B没有使用这些引用，而文件A引用了文件B，导致文件B的所有引用也被A引用，这似乎并不合理） 5. 修改了引用的顺序（os、random等系统引用应放在自定义模块引用的上方） 6. 修改了过长的代码，注释除外（每行限制在100个字符以内） 7. 优化了条件判断的判断符号： is和is not 用于判断两个变量是否指向同一个位置 == 和 !=用于比较两个变量 8. 为每个py文件添加了"last new line"，删除了多余的尾部空行 Pylint提示了但是没有进行的操作： 1. 将字符串改为f-string的格式因为f-string需要python3.6以上的版本，为了防止出现版本问题，故不做修改 2. 将所有函数内的return内容改为一致的类型因为原有的代码逻辑已经确定，修改return的类型会导致方法的无法使用，故不做修改 3. 将标识符的格式改为"snake_case naming style" 标识符的修改内容过于庞大，且可能出现程序不可预见的错误，在pylint中重要等级为0，故不做修改 JSLint Part: 1. 提高代码的可读性：将部分超过80个字符的代码行拆解开（由于文字注释的存在，很多语句仅注释就超过了80个字符，此类型的语句行不做修改） 2. 用===与！==代替==与！=的判断 3. 将i++改为i+=1 4. 分离for循环中的let与var到其他行中，以适应JSLint在循环语句中对var和let的偏好 5. 给三元表达式外围添加圆括号，避免出现优先级的问题 6. 将正则表达式修改为JSLint要求的多行模式疑问：形如： for (let i = 0; i < list.length; i+=1) { 的语句，JSLint报错： [JSLint was unable to finish] Unexpected 'let'. 但是网上搜索到的结果是ES6是支持let的使用的，暂且不做修改。 2023-05-26 22:18:11 +08:00			`'''`
			`Store the information in list lst to dictionary d.`
Publish EnglishPal source code 2021-04-06 16:22:03 +08:00			`Note: nothing is returned.`

			`'''`
			`for x in lst:`
			`word = x[0]`
			`freq = x[1]`
			`if not word in d:`
Pylint部分： 1. 补充module docstring，即文档顶部的简要说明（我做的说明很简陋，只是为了通过pylint的检查而为之） 2. 优化了if-else-return，即删除了不必要的elif或else 3. 拆分了所有在同一行的模块引用（不同模块的引用需要放在不同行，以便理解和阅读） 4. 删除了部分没有被使用的引用（有的引用在文件A中被使用了，但import却写在了文件B，且文件B没有使用这些引用，而文件A引用了文件B，导致文件B的所有引用也被A引用，这似乎并不合理） 5. 修改了引用的顺序（os、random等系统引用应放在自定义模块引用的上方） 6. 修改了过长的代码，注释除外（每行限制在100个字符以内） 7. 优化了条件判断的判断符号： is和is not 用于判断两个变量是否指向同一个位置 == 和 !=用于比较两个变量 8. 为每个py文件添加了"last new line"，删除了多余的尾部空行 Pylint提示了但是没有进行的操作： 1. 将字符串改为f-string的格式因为f-string需要python3.6以上的版本，为了防止出现版本问题，故不做修改 2. 将所有函数内的return内容改为一致的类型因为原有的代码逻辑已经确定，修改return的类型会导致方法的无法使用，故不做修改 3. 将标识符的格式改为"snake_case naming style" 标识符的修改内容过于庞大，且可能出现程序不可预见的错误，在pylint中重要等级为0，故不做修改 JSLint Part: 1. 提高代码的可读性：将部分超过80个字符的代码行拆解开（由于文字注释的存在，很多语句仅注释就超过了80个字符，此类型的语句行不做修改） 2. 用===与！==代替==与！=的判断 3. 将i++改为i+=1 4. 分离for循环中的let与var到其他行中，以适应JSLint在循环语句中对var和let的偏好 5. 给三元表达式外围添加圆括号，避免出现优先级的问题 6. 将正则表达式修改为JSLint要求的多行模式疑问：形如： for (let i = 0; i < list.length; i+=1) { 的语句，JSLint报错： [JSLint was unable to finish] Unexpected 'let'. 但是网上搜索到的结果是ES6是支持let的使用的，暂且不做修改。 2023-05-26 22:18:11 +08:00			`d[word] = freq`
Publish EnglishPal source code 2021-04-06 16:22:03 +08:00			`else:`
			`d[word] += freq`


			`def dict2lst(d):`
			`return list(d.items()) # a list of (key, value) pairs`
Pylint部分： 1. 补充module docstring，即文档顶部的简要说明（我做的说明很简陋，只是为了通过pylint的检查而为之） 2. 优化了if-else-return，即删除了不必要的elif或else 3. 拆分了所有在同一行的模块引用（不同模块的引用需要放在不同行，以便理解和阅读） 4. 删除了部分没有被使用的引用（有的引用在文件A中被使用了，但import却写在了文件B，且文件B没有使用这些引用，而文件A引用了文件B，导致文件B的所有引用也被A引用，这似乎并不合理） 5. 修改了引用的顺序（os、random等系统引用应放在自定义模块引用的上方） 6. 修改了过长的代码，注释除外（每行限制在100个字符以内） 7. 优化了条件判断的判断符号： is和is not 用于判断两个变量是否指向同一个位置 == 和 !=用于比较两个变量 8. 为每个py文件添加了"last new line"，删除了多余的尾部空行 Pylint提示了但是没有进行的操作： 1. 将字符串改为f-string的格式因为f-string需要python3.6以上的版本，为了防止出现版本问题，故不做修改 2. 将所有函数内的return内容改为一致的类型因为原有的代码逻辑已经确定，修改return的类型会导致方法的无法使用，故不做修改 3. 将标识符的格式改为"snake_case naming style" 标识符的修改内容过于庞大，且可能出现程序不可预见的错误，在pylint中重要等级为0，故不做修改 JSLint Part: 1. 提高代码的可读性：将部分超过80个字符的代码行拆解开（由于文字注释的存在，很多语句仅注释就超过了80个字符，此类型的语句行不做修改） 2. 用===与！==代替==与！=的判断 3. 将i++改为i+=1 4. 分离for循环中的let与var到其他行中，以适应JSLint在循环语句中对var和let的偏好 5. 给三元表达式外围添加圆括号，避免出现优先级的问题 6. 将正则表达式修改为JSLint要求的多行模式疑问：形如： for (let i = 0; i < list.length; i+=1) { 的语句，JSLint报错： [JSLint was unable to finish] Unexpected 'let'. 但是网上搜索到的结果是ES6是支持let的使用的，暂且不做修改。 2023-05-26 22:18:11 +08:00
Publish EnglishPal source code 2021-04-06 16:22:03 +08:00
			`def merge_frequency(lst1, lst2):`
			`d = {}`
			`lst2dict(lst1, d)`
			`lst2dict(lst2, d)`
			`return d`


			`def load_record(pickle_fname):`
			`f = open(pickle_fname, 'rb')`
			`d = pickle.load(f)`
			`f.close()`
			`return d`


			`def save_frequency_to_pickle(d, pickle_fname):`
			`f = open(pickle_fname, 'wb')`
			`#exclusion_lst = ['one', 'no', 'has', 'had', 'do', 'that', 'have', 'by', 'not', 'but', 'we', 'this', 'my', 'him', 'so', 'or', 'as', 'are', 'it', 'from', 'with', 'be', 'can', 'for', 'an', 'if', 'who', 'whom', 'whose', 'which', 'the', 'to', 'a', 'of', 'and', 'you', 'i', 'he', 'she', 'they', 'me', 'was', 'were', 'is', 'in', 'at', 'on', 'their', 'his', 'her', 's', 'said', 'all', 'did', 'been', 'w']`
			`exclusion_lst = []`
			`d2 = {}`
			`for k in d:`
			`if not k in exclusion_lst and not k.isnumeric() and len(k) > 1:`
			`d2[k] = d[k]`
			`pickle.dump(d2, f)`
			`f.close()`

Update pickle_idea.py 在生词簿每个单词后面，加上两个按钮，熟悉与不熟悉。如果点熟悉，就将生词簿中该单词后面记录的添加次数减一，直至减为0，就将该单词从生词簿中移除；如果点不熟悉，就将生词簿中该单词后面记录的添加次数加一。 2021-05-31 08:48:03 +08:00			`def unfamiliar(path,word):`
			`f = open(path,"rb")`
			`dic = pickle.load(f)`
			`dic[word] += [datetime.now().strftime('%Y%m%d%H%M')]`
			`fp = open(path,"wb")`
			`pickle.dump(dic,fp)`

			`def familiar(path,word):`
			`f = open(path,"rb")`
			`dic = pickle.load(f)`
			`if len(dic[word])>1:`
			`del dic[word][0]`
			`else:`
			`dic.pop(word)`
			`fp = open(path,"wb")`
			`pickle.dump(dic,fp)`
Publish EnglishPal source code 2021-04-06 16:22:03 +08:00
			`if __name__ == '__main__':`

			`lst1 = [('apple',2), ('banana',1)]`
			`d = {}`
			`lst2dict(lst1, d) # d will change`
			`save_frequency_to_pickle(d, 'frequency.p') # frequency.p is our database`


			`lst2 = [('banana',2), ('orange', 4)]`
			`d = load_record('frequency.p')`
			`lst1 = dict2lst(d)`
			`d = merge_frequency(lst2, lst1)`
			`print(d)`