小改了一下,可以正常去除单词前后多余的连字符
parent
d136c93df6
commit
b923d805e3
|
@ -43,8 +43,9 @@ def remove_punctuation(s): # 这里是s是形参 (parameter)。函数被调用
|
|||
|
||||
cop = re.compile("[^-^a-z^A-Z^\\']") # 通过正则表达式保留英文字符和'特殊字符
|
||||
s = cop.sub(' ', s)
|
||||
s = s.strip('-') #去除头尾连字符
|
||||
s = s.strip('--') #去除头尾连字符
|
||||
s = s.strip() # 去除前后的空格
|
||||
s = s.strip('--')
|
||||
|
||||
if '\'' in s:
|
||||
n = len(s)
|
||||
|
|
Loading…
Reference in New Issue