forked from mrlan/EnglishPal
				
			小改了一下,可以正常去除单词前后多余的连字符
							parent
							
								
									d136c93df6
								
							
						
					
					
						commit
						b923d805e3
					
				| 
						 | 
					@ -43,8 +43,9 @@ def remove_punctuation(s): # 这里是s是形参 (parameter)。函数被调用
 | 
				
			||||||
 | 
					
 | 
				
			||||||
    cop = re.compile("[^-^a-z^A-Z^\\']")  # 通过正则表达式保留英文字符和'特殊字符
 | 
					    cop = re.compile("[^-^a-z^A-Z^\\']")  # 通过正则表达式保留英文字符和'特殊字符
 | 
				
			||||||
    s = cop.sub(' ', s)
 | 
					    s = cop.sub(' ', s)
 | 
				
			||||||
    s = s.strip('-')     #去除头尾连字符
 | 
					    s = s.strip('--')    #去除头尾连字符
 | 
				
			||||||
    s = s.strip()  # 去除前后的空格
 | 
					    s = s.strip()  # 去除前后的空格
 | 
				
			||||||
 | 
					    s = s.strip('--')
 | 
				
			||||||
 | 
					
 | 
				
			||||||
    if '\'' in s:
 | 
					    if '\'' in s:
 | 
				
			||||||
        n = len(s)
 | 
					        n = len(s)
 | 
				
			||||||
| 
						 | 
					
 | 
				
			||||||
		Loading…
	
		Reference in New Issue