Grep
Jihongchang(讨论 | 贡献)2023年2月4日 (六) 05:20的版本
抓汉字
$ curl -s www.baidu.com|grep -Po '[\p{Han}]+'
百度一下
你就知道
百度一下
新闻
地图
视频
贴吧
登录
登录
更多产品
关于百度
使用百度前必读
意见反馈
京
证
号
-P 指定应用 Perl 正则表达式
-o 指定仅显示匹配 PATTERN 的那一部分
[\p{Han}] 指定了是汉字字符
$ curl -s www.baidu.com|grep -Po '[\p{Han}]+'
百度一下
你就知道
百度一下
新闻
地图
视频
贴吧
登录
登录
更多产品
关于百度
使用百度前必读
意见反馈
京
证
号
-P 指定应用 Perl 正则表达式
-o 指定仅显示匹配 PATTERN 的那一部分
[\p{Han}] 指定了是汉字字符