您好,匿名用户
随意问技术百科期待您的加入

求一个正则表达式

0 投票

将下面的文字分割成5段

1、其他文字2、3.879(其他文字中包括小数)3.123加4、加其他(其他文字中包括数字和顿号)4、(其他文字为空)5.其他文字
(数字开头后面跟着顿号和点符号)
1、其他文字
2、3.879(其他文字中包括小数)
3.123加4、加其他(其他文字中包括数字和顿号)
4、(其他文字为空)
5.其他文字

如果不用正则,PHP下有其他解决办法吗?

用户头像 提问 2012年 12月1日 @ Soraka 上等兵 (319 威望)
分享到:

1个回答

0 投票

是指这个特例还是指普遍情况?
如果是普遍情况的话,不可能在不解读文字语义的情况下靠纯正则实现。
正则需要足够的约定条件来明确,比如说,是否每个行号后面的标点符号都按你上面的例子一样,1、2、4后面就是顿号,3、5后面就是点号?

暂时先按照你这个特例来弄一个来玩玩。(其他文字为空)这部分我先当作删掉处理了……

$t="1、其他文字2、3.879(其他文字中包括小数3.154)3.123加4、加其他(其他文字中包括数字和顿号)4、5.其他文字";
$re='~
	1、[^\d]+
	|2、[^、]+(?=3\.)
	|3\..+(?=4、)
	|4、.*(?=5.)
	|5\..*
	~x';
if (preg_match_all($re, $t, $tokens, PREG_PATTERN_ORDER)) {
	foreach ($tokens[0] as $w) {
		echo "<br/>".$w."<br/>";
	}
}

说实话我觉得用简单正则(数字、点号、顿号、其他四种情况)把整段话拆散,依次读入并逐步按逻辑规则归档的方式来做(类似于readline的形式逐行读取)最明确,适用面也是最广的,因为这样至少有完善的缓存回退机制(例如读到2、时即可输出1、,后再次读到下一个顿号时可以回退到上一个3.输出,读到最后一个.后回退到上一个4、输出)。正则的非捕捉匹配在复杂情况下实在不是太给力啊……

用户头像 回复 2012年 12月1日 @ Ashe 上等兵 (336 威望)
提一个问题:

相关问题

0 投票
1 回复 30 阅读
用户头像 提问 2012年 12月1日 @ Aquarius 上等兵 (283 威望)
0 投票
1 回复 38 阅读
用户头像 提问 2012年 12月1日 @ Kha'Zix 上等兵 (269 威望)
0 投票
1 回复 51 阅读
用户头像 提问 2012年 12月1日 @ Shyvana 上等兵 (214 威望)
0 投票
1 回复 39 阅读
用户头像 提问 2012年 12月1日 @ Aries 上等兵 (238 威望)
0 投票
1 回复 33 阅读
用户头像 提问 2012年 12月1日 @ Cassiopeia 上等兵 (317 威望)

欢迎来到随意问技术百科, 这是一个面向专业开发者的IT问答网站,提供途径助开发者查找IT技术方案,解决程序bug和网站运维难题等。
温馨提示:本网站禁止用户发布与IT技术无关的、粗浅的、毫无意义的或者违法国家法规的等不合理内容,谢谢支持。

欢迎访问随意问技术百科,为了给您提供更好的服务,请及时反馈您的意见。
...