1
Mountain 2023-10-22 17:46:09 +08:00
写正则
|
2
shendaowu 2023-10-22 17:53:15 +08:00
*北*大*招*办*。这个顺序必须一样。
北 大 办 招。这个比上面的更好一些,顺序错了也能搜出来。就是所有字中间都加上英文空格。 |
3
shendaowu 2023-10-22 17:57:01 +08:00
如果是同义词那种应该就很难搜出来了。另外建议 OP 把各种可能的情况都说一下,模糊搜索好像包含挺多功能的。
|
4
shendaowu 2023-10-22 21:16:40 +08:00 1
还有个更好一点的方法,需要这个软件: https://seekfast.org/seekfast 。这是个全文搜索的软件。用这个软件主要是因为 everything 搜出来的结果不能按照命中的关键词数量排序。
用“北|大|办|招”搜索出所有结果,然后导出搜索结果为 txt 文件,最好是给这个导出的 txt 文件单独建一个文件夹。然后用 seekfast 在那个导出的 txt 文件所在的文件夹建立索引。然后搜索“北 大 招 办”,记得勾选“Any of words”。然后大概就会按命中的关键词的个数排序了。感觉跟搜索引擎的效果差不多了,除了同义词之类的。不过我测试的时候发现好像不是严格按照命中个数排序的,看了一下说明,好像关键词的顺序会显著影响排序。 还有这个软件的排序好像更好一些: https://anytxt.net/ 。不介绍怎么用了,大同小异。我写完上段才发现我下载了这个软件,用了一下发现比上面那个好。 另外有一些 js 全文索引的库,也许可以写一个自动导入上面的 txt 文件的小程序。我搜了半天也没找到现成的在线导入并搜索的网站。不知道为啥没有,感觉好像用不着服务器资源,直接用静态网站就能做。搞得我都想做一个这样的在线工具了。问一下 OP ,你这个功能用得多不多?或者用的人多不多?或者重不重要?如果多或者重要的话我以后有时间可能会写一个放 github pages 上。毕竟那个 seekfast 的搜索功能有点太简单了。另外我看 V2EX 偶尔会有一些找点子甚至给写工具的人,你有兴趣可以站内搜搜。 我花了大概两个小时才解决这个问题,OP 我不求你点感谢,就回复一下解决程度就行了。另外我主要是闲得蛋疼才想要解决这个问题的,另外也感觉自己可能会有这个需求,所以就挑战了一下。 |
5
BeautifulSoap 2023-10-22 21:20:38 +08:00 via Android
用正则就行,但是结果并不一定符合你预期
比如搜出“东北大基金招募办法“之类的 |
6
shendaowu 2023-10-22 21:27:12 +08:00
SeekFast 和 AnyTXT Searcher 好像都只能搜索文件内容,不能搜索文件名。
|
7
shendaowu 2023-10-22 21:39:25 +08:00
收回前面的做小工具的话。我感觉我做不出比 AnyTXT Searcher 更好的工具。
|
8
em70 2023-10-22 21:53:41 +08:00
这个软件可以出个 embedding 版
|