当前位置:首页 > 云计算 > 正文内容

python3如何提取汉字

2022-05-04 03:01:19云计算2

采用正则表达式的方法对字符串进行处理。

str1="{我%$是,《速$@.度\发》中/国、人"

相关推荐:《Python教程》

(1)提取汉字

汉字的范围为”\u4e00-\u9fa5“,这个是用Unicode表示的。

importre
res1=''.join(re.findall('[\u4e00-\u9fa5]',str1))
print(res1)

输出为:

‘我是速度发中国人’

(2)去除所有符号。采用清理数据,仅保留字母、数字、中文的方法。

importre
res1=re.sub("[^a-zA-Z0-9\u4e00-\u9fa5]",'',str1)
print(res1)

输出为:

‘我是速度发中国人’

本网站文章仅供交流学习 ,不作为商用, 版权归属原作者,部分文章推送时未能及时与原作者取得联系,若来源标注错误或侵犯到您的权益烦请告知,我们将立即删除.

本文链接:https://www.xibujisuan.cn/3508.html

标签: Python