使用WORD通配符替换去除网页中的干扰码(乱码)

时间:2024-10-18 12:21:02

1、从网页复制内容到WORD,并认真观察干扰码的规律。以图示为例,我们发现,需要的正文为纯汉字。干扰码为数字、英语和符号。

使用WORD通配符替换去除网页中的干扰码(乱码)

2、对曳骣苷镐照ACSII码表,数字段十进制代码为48-57,大写英文十进制代码为65-90,其他为各类符号。由于我们需要保留的为纯汉字,所以可以将ACSII码表32-126码段全部替换为空。

使用WORD通配符替换去除网页中的干扰码(乱码)

3、在W蚪嬷吃败ORD中按“CTRL+H”调出替换窗口,在查找内容栏输入[^32-^126],然后在搜索选项勾选“使用通配符”,然后点击“全部替换”就可以得到干净清爽的正文了。

使用WORD通配符替换去除网页中的干扰码(乱码)
使用WORD通配符替换去除网页中的干扰码(乱码)
© 手抄报圈