Wps表格中用正则提取拼音

如下图所示,A2:A5单元格区域中是含拼音的文本,现需要将拼音单独提取出来

Wps表格中更新了RegExp正则函数,现在可以用这个函数来愉快地提取拼音了,如下图

提取公式是:=REGEXP(A2,"\p{Latin}+")

此处的关键是第二个参数,也就是正则表达式"\p{Latin}+"匹配的是连续的拉丁字母。

\p{...}这种形式是Unicode属性转义序列的一种表示方法,其通常遵循\p{...}\P{...}的语法,其中...是Unicode属性的名称。

\p{...}匹配具有指定属性的字符,而\P{...}匹配不具有该属性的字符。比如:

  • \p{Han}:匹配中文本字符(不含标点和各种符号)

  • \p{L}:匹配字母字符(含中文,拉丁字母等,不含标点、括号和数字)

  • \p{Lu}:匹配大写字母

  • \p{Ll}:匹配小写字母

  • \p{Latin}:匹配拉丁字母

  • \p{Common}:匹配数字、标点、和各种符号(不含中文,英文等字母)

  • \p{N}:匹配所有数字(包括罗马数字,阿拉伯数字等)

  • \p{Nd}:匹配阿拉伯数字

  • \p{Nl}:匹配罗马数字(注意不是普通的IVXL等字符而是专有的拉丁数字ⅠⅡⅢⅣⅤⅥⅦⅧⅨⅩⅪⅫⅬⅭⅮⅯⅰⅱⅲⅳⅴⅵⅶⅷⅸⅹⅺⅻⅼⅽⅾⅿ)

河南省
浏览 1609
2
6
分享
6 +1
10
2 +1
全部评论 10
 
杨玉米
打卡
· 河北省
回复
 
马成功老师
马成功老师

创作者俱乐部成员

赞赞赞。果断收藏
· 北京
回复
 
懒得批爆
懒得批爆

创作者俱乐部成员

这一点,有没有匹配罗马数字的表达式
· 四川省
回复
Boyuan
有的,是“\p{Nl}“贴子更新过了,不过遗憾的是得是专有的拉丁数字,不是函数转出来的字母组合
· 河南省
回复
 
懒得批爆
懒得批爆

创作者俱乐部成员

提取拼音这个功能相当的鸡肋,除了有这个能力外,并没有什么卵用。 1、WPS表格不支持显示拼音字段,所以拼音指南只会在WPS文字中使用。 2、WPS文字不支持regexp函数 3、WPS文字Windows版的拼音指南支持直接分离拼音不需要regexp函数。 4、WPS表格不支持将WPS文字中的拼音字段粘贴到WPS表格中。 5、复制后拼音也只能以文本形式存在。
· 四川省
回复