首页 » Web前端 » phpemoji过滤技巧_python 过滤特殊字符 emoji

phpemoji过滤技巧_python 过滤特殊字符 emoji

duote123 2024-11-24 0

扫一扫用手机浏览

文章目录 [+]

1 条件背景

通过爬虫获取到的数据,要存入数据库,由于数据库的编码问题,一些分外字符涌现缺点,无法进入数据库

办理办法:过滤掉这些分外字符,包含emoji表情等各种分外字符2 剔除除中英文及数字外的其他任何字符

这种方法大略粗暴,直接把非中英文及数字的所有字符串删除,代码如下:

phpemoji过滤技巧_python 过滤特殊字符 emoji

import redef filter_str(desstr, restr=''): # 过滤除中英文及数字以外的其他字符 res = re.compile("[^\u4e00-\u9fa5^a-z^A-Z^0-9]") return res.sub(restr, desstr)3 emoji 表情库【方法 1】:emoji 处理库,emoji 官网:https://pypi.org/project/emoji/

# 安装 pip install emoji

import emojiemoji_str = "python is "# 分外字符转换为正常字符(相称于解码)str = emoji.demojize(emoji_str)print(str)# 正常字符转换为分外字符(相称于编码)emoji_str = emoji.emojize(str)print(emoji_str)

运行结果:

phpemoji过滤技巧_python 过滤特殊字符 emoji
(图片来自网络侵删)

【方法 2】:过滤表情

import redef filter_emoji(desstr, restr=''): # 过滤表情 res = re.compile(u'[\U00010000-\U0010ffff\uD800-\uDBFF\uDC00-\uDFFF]') return res.sub(restr, desstr)# 打印所有字符for i in range(0x0, 0x10ffff): print(filter_emoji(chr(i)), end=", ") if i % 16 == 15: print()

快速理解RPA

RPA RPA技能 RPA软件 RPA培训 RPA运用 RPA机器人

领域 数据统计

沪ICP备12049238号 版

标签:

相关文章

介绍百度码,技术革新背后的智慧之光

随着科技的飞速发展,互联网技术已经成为我们生活中不可或缺的一部分。而在这个信息爆炸的时代,如何快速、准确地获取信息,成为了人们关注...

Web前端 2025-01-03 阅读1 评论0

介绍皮箱密码,开启神秘之门的钥匙

皮箱,作为日常生活中常见的收纳工具,承载着我们的珍贵物品。面对紧闭的皮箱,许多人却束手无策。如何才能轻松打开皮箱呢?本文将为您揭秘...

Web前端 2025-01-03 阅读1 评论0

介绍盗号器,网络安全的隐忧与应对步骤

随着互联网的快速发展,网络安全问题日益突出。盗号器作为一种非法工具,对网民的个人信息安全构成了严重威胁。本文将深入剖析盗号器的原理...

Web前端 2025-01-03 阅读1 评论0