您好,匿名用户
随意问技术百科期待您的加入

PHP如何提高文件查询效率

+1 投票

要从一个文件中查出以唯一字符串 a 开头的那一行,怎么能提高查询效率。
我现在的方法很笨:

  • 按行把文件内容存入一个数组
  • 用正则去match数组中的每一个元素直到找到为止

这样感觉效率很低,因为文件有17万行,所以最低也要循环17万次...
初学者希望得到大家的帮助,谢谢。

用户头像 提问 2013年 1月19日 @ Kyrie 上等兵 (240 威望)
分享到:

1个回答

+1 投票
 
最佳答案

这个文件处理成一个用字典树(trie)或者B树存储的结构,然后就可以快速查询了。

前面说得可能太抽象,给你一个容易实现的算法吧。效率虽然比trie/b-tree略低,但是也很够用。

预处理

1. 遍历这个文件,记录每行的offset记录下来,作为int的数组。
2. 对这个数组进行间接排序。注意,所谓间接,指的是排序时比较的是这个数组元素指向的行。
3. 将这个数组保存起来(17w个int,也就不到700KB,随便什么地方保存)。

查询

1. 读取这个数组。
2. 使用"间接"二分查找。注意,查找时比较的是对应行的前n个字符,n == strlen(a)。

如果看不懂这个算法的话,那就洗洗睡吧。

用户头像 回复 2013年 1月19日 @ Kennen 上等兵 (442 威望)
选中 2013年 1月19日 @Saber
提一个问题:

相关问题

0 投票
1 回复 49 阅读
用户头像 提问 2012年 12月1日 @ Karma 上等兵 (229 威望)
+1 投票
1 回复 66 阅读
用户头像 提问 2013年 1月26日 @ Kyrie 上等兵 (240 威望)
0 投票
0 回复 6 阅读
用户头像 提问 2014年 4月3日 @ Pisces 上等兵 (182 威望)
0 投票
0 回复 24 阅读
+1 投票
1 回复 138 阅读
用户头像 提问 2012年 12月12日 @ Saber 中士 (1,234 威望)

欢迎来到随意问技术百科, 这是一个面向专业开发者的IT问答网站,提供途径助开发者查找IT技术方案,解决程序bug和网站运维难题等。
温馨提示:本网站禁止用户发布与IT技术无关的、粗浅的、毫无意义的或者违法国家法规的等不合理内容,谢谢支持。

欢迎访问随意问技术百科,为了给您提供更好的服务,请及时反馈您的意见。
...