我是一个在计算机视觉里蝶泳的科研狗,一个文献管理软件基本是我的刚需。从硕到博这么多年用了各种各样的软件:Papers 、Mendely 、Readcub Papers 、Zotero ,没有一款能让我满意舒服的。
诚然这些软件都是伟大的软件,但是或多或少都有些小问题,比如:
而我想要的就是一个简简单单的论文管理软件:
于是,一年多以前,在博士刚开始的时候,我就开始着手自己开发一个,符合上述需求的软件。
跟周围同学分享了一下,大家都觉得挺好用的。之前因为觉得不完美,害怕推广了之后自己没精力维护。经过一年多的打磨,这个软件也伴随我一年多的科研,加两次论文投稿。我已经把大部分功能做到我满意的地步了。所以在这里分享一下,给有同样需要的科研狗们!它就是 Paperlib !
最后的最后,祝大家科研顺利吧!
1
mobpsycho100 2022-06-24 04:12:20 +08:00
跟 paperpile 比有什么优缺点吗?
|
2
yzbythesea 2022-06-24 04:13:39 +08:00
wow
UI 很赞 |
3
SorryChen OP @mobpsycho100 我想是 metadata 匹配吧,因为我是这个领域的人,所以所有的 metadata scraper 都是我完全定制的。可以尽量准确地搜到在哪发表
|
4
SorryChen OP @mobpsycho100 大部分市面的软件,对 NIPS ,ICLR ,ICML 几个会议,匹配很差
|
5
hackpro 2022-06-24 04:54:14 +08:00
感谢大佬分享 太顶了🙏
反馈一个 Chrome extension 的问题 试了几遍一直会出现 Could not decode 128.png 希望排查一下 |
8
SorryChen OP 新的 Chrome extension 提交审核了。icon 坏了。。 审核通过就可以了
|
9
hackpro 2022-06-24 05:04:56 +08:00
另外安装了 latest.dmg 运行后只显示白色毛玻璃背景的界面
我感觉是不是什么地方初始化卡住了 有哪里可以看应用 log 什么的吗 可以协助你排查一下 |
10
SorryChen OP @hackpro 你是 mac 嘛。加个 wx 细聊。。。没想到第一天就遇到这么多问题哈哈哈 base64: Z2VvZmZyZXljaGVuNzc3
|
11
BarryPan 2022-06-24 08:14:13 +08:00 via iPhone
看设计风格结合了 Zotero 和 Papers 的元素,非常美观啊
|
12
winstars 2022-06-24 08:57:45 +08:00 via Android
需要 linux arm 版本。
|
13
evenno 2022-06-24 09:22:29 +08:00
以前觉得读书没用, 看到博士的真材实料,下定决心让子女要好好读书
|
14
noming 2022-06-24 09:26:12 +08:00
太强了,界面美观,功能强大
有个问题,我打开 Preference - Cloud ,界面是空白的,没有任何设置选项 |
15
noming 2022-06-24 09:27:05 +08:00
系统是 Windows 10 LTSC 2019
|
16
tilv37 2022-06-24 09:27:06 +08:00
我现在知网研学用的飞起。主要是插入文献引用是真方便啊
|
17
Magentaize 2022-06-24 09:28:34 +08:00 via iPhone
wow ,我在硕士期间就想着自己搞一个,但是完成度太低了。op 太强了👍
|
18
ttgo 2022-06-24 09:32:35 +08:00
这种收集+管理类的软件,迁移就会伤筋动骨,如果不是 LTS ,有点不敢用啊!
ps:惊闻 mendeley 桌面版 9/1 就停止更新了 ! |
19
geoisdidi 2022-06-24 09:46:27 +08:00
cool
|
20
cheneydog 2022-06-24 10:17:39 +08:00
electron 挺好的了
|
24
SorryChen OP @winstars 因为我没 linux 机器,理论上 electron 很好编译出 linux 版,如果你有机器愿意帮忙可以试一试,感谢
|
25
zhl 2022-06-24 13:40:15 +08:00
试试 citavi 吧
|
26
huntley 2022-06-24 14:05:19 +08:00
支持 webdav 吗? zotero 还有 rss 订阅、ipad 客户端和网页端,可以加各种插件,可以记笔记,6.0 版本自带的 pdf 阅读器也蛮好用的,word 插件引用文献也挺方便。zotero 功能我觉得挺好用的,UI 太丑了那是真的。
|
27
SorryChen OP @huntley webdav 支持。rss 正在开发,ipad 客户端我应该没有精力去弄,个人很少在平板上看论文。PDF 阅读器我没准备弄,因为有很多专门的 pdf 阅读器,我想把这个功能解耦。我这里从没用 word 写过论文,全都是 latex 。功能全面性肯定是比不过人家大团队做的毕竟我就一个人。但是对于最重要的元数据检索,我还是有信心我这个最准,最起码对于 CV 领域来说。
|
28
SorryChen OP @huntley 如果习惯于 latex 写论文我想用我这个会很方便,cmd shift i 快捷检索插入,很顺手
|
29
nightwitch 2022-06-24 14:20:22 +08:00 via Android
其实信息不准的问题只需要从 dblp 重新抓一下就好,忘了 zotero 默认从哪里抓元信息了,我的经验是 dblp 的元信息最完善。不过我之前期刊文章都是直接引的 arxiv 版本,编辑也没难为我
|
30
SorryChen OP @nightwitch 确实,dblp 相对是最全的,但是需要他收录,有的收录比较慢,比如这两天刚开会的 CVPR 2022 ,我想他一定检索不到,因为我写了 CVF 的爬虫,所以能找到,ICCV21 也是这两天才检索到的,我这里第一时间就检索到了。
主要还是少点步骤,更方便一些吧,以前我有一次 editor 就怼我说我引用的不对,所以就下决心写了这么一个软件。 |
31
wherelse 2022-06-24 14:26:49 +08:00
厉害,虽然马上要硕士毕业了,但还是要支持作者
|
32
vsitebon 2022-06-24 14:26:56 +08:00
@SorryChen 这个快捷键可能需要加上一个选项 /修改方式,或者是我暂时没找到选项。。因为我想开控制台的时候发现这个被全局占用了
|
33
synsynink 2022-06-24 14:27:36 +08:00
好牛,让我这个正在用 papers 的科研狗来体验一下!
|
34
SorryChen OP @noming 您好,我这里找了个 windows 电脑没发现您说的问题,您方便加个 wx 聊一下么,感谢 base64:Z2VvZmZyZXljaGVuNzc3
|
36
vsitebon 2022-06-24 14:30:29 +08:00
@SorryChen 准确来说,是我想开浏览器的控制台的时候,会因为被 paperlib 占用(优先级更高?),然后就只能打开 paperlib 的搜索了。
|
37
huntley 2022-06-24 14:30:52 +08:00
@SorryChen 我平时英文论文用 latex ,中文很多期刊不接受 latex 投稿,没办法只能用 word 。我试试你这个,觉得很不错,谢谢开源啊。
|
38
SorryChen OP @vsitebon 嗷嗷明白了,您是 windows 电脑应该。mac 这边控制台是 cmd option i ,和那个快捷键不冲突,所以我没注意到,感谢您的回复,我想应该暂时按 F12 也可以打开控制台,下个版本会加上改键。感谢。
|
40
l0o0 2022-06-24 14:35:54 +08:00
非常支持楼主的开发,不过现在 Zotero 有一些插件的加持,还是不错的。希望能增加对中文的支持,这样估计能圈一波国内用户
|
41
xyxiao 2022-06-24 14:36:33 +08:00
同去年开始读博,但怕 op 毕业比我早,不敢用。
|
43
SorryChen OP @huntley cite key 目前是跟 google scholar 一个格式,好像是 zotero 有个插件做这个事?我可以去研究下他怎么弄的。
|
45
SorryChen OP @l0o0 确实 插件 zotero 很丰富,我确实需要一些 zotero 深度用户反馈哪些功能是 zotero 无可替代的。中文的话,您是说 UI 中文还是 论文中文?
|
46
huntley 2022-06-24 14:42:33 +08:00
@SorryChen zotero 那个插件超级卡,不好用。jabref 也可以做这个事,在 github 上开源的,或许也可以参考。
|
49
SorryChen OP @huntley 如果您是 mac ,选中一个论文,您可以按一下空格试试,如果是 win ,按一下空格虽然不是像 mac 那么丝滑,但是也够用。您说的应该是这个功能吧
|
50
AnsonUTF8 2022-06-24 15:00:44 +08:00
做得太赞了! NLP 也基本上抓得很准确。顺便问个小问题,我看没有已读未读标记,你平时一般怎么区分已读和准备读的文章呢?
|
51
wtdd 2022-06-24 15:06:05 +08:00
会议论文是个痛点,先赞再试^_^
|
53
SorryChen OP @AnsonUTF8 我这边都是 arxiv 啊公众号啊啥的看到论文,直接浏览器打开扫一扫,如果觉得值得我细读,我会用 chrome 插件,导入 paperlib ,如果一般般我就直接关了。但是现在 chrome 插件还在审核。。。。google 审核好慢。。。可能得等一段时间
|
54
tibifide 2022-06-24 15:13:13 +08:00
好多专业名称,头大
|
55
tibifide 2022-06-24 15:13:40 +08:00
我用印象笔记。。
|
56
Detao 2022-06-24 15:16:27 +08:00
看着很不错啊, 但我是 papers 用习惯了...
|
58
jamosLi 2022-06-24 15:17:25 +08:00
中文语言包吧,像我这的小垃圾。想看点论文都不知道去哪里看。
bug:安装的时候会提示,证书问题,装完后 C 盘应该是无权限,导致功能无法用。win10 |
59
SorryChen OP @jamosLi windows 证书,我这个问题是知道的,但是查了查,windows 的证书好像都很贵。。。不知道各位有人知道 windows 有没有免费证书。。。C 盘权限是什么意思呢?我这边是 mac ,能麻烦您说一下或者微信交流下么 感谢 base64:Z2VvZmZyZXljaGVuNzc3
|
62
SorryChen OP @Detao 如果是 readcube papers 的话,它是我最后一个用的产品,当时最大的感受就是他的 metadata 匹配很不准 😂
|
63
kappa 2022-06-24 15:38:42 +08:00
希望增加 Firefox addon 支持。。
|
66
huntley 2022-06-24 15:46:13 +08:00
试用了 paperlib ,元数据抓取确实很准确,非常好用!不知能不能在元数据里加上摘要和 url ,还有希望能用方向键头作为选中论文的快捷键。我现在可以把 zotero 作为仓库,paperlib 作为写作时需要引用的文献的存放处,棒!
|
67
SorryChen OP @huntley 啊啊摘要这个主要是个人习惯,我基本上没怎么在文献管理软件中看过摘要,可以考虑考虑哈
|
68
LinePro 2022-06-24 16:09:31 +08:00
好用!支持楼主!
提一个小需求:如果元数据抓取可以设置代理就更好了(毕竟有谷歌学术源 233 |
70
l0o0 2022-06-24 16:12:25 +08:00
@SorryChen 我觉得有些功能是:1. 元数据更新功能,因为有些 artix 上论文是预览,和正式发布后有一些区别(当时还有其他情况可能导致正式版和预发布版不同)
2. 对中文学术文库知网,万方,维普等的元数据抓取支持。目前这些中文元数据是一些同学在维护,具体有哪些,可以查看 https://github.com/l0o0/translators_CN |
71
noming 2022-06-24 16:13:58 +08:00
升级安装后可以设置 Cloud 了 👍👍👍
|
72
SorryChen OP @l0o0 1. 元数据是可以更新的,并且我做了自动更新功能,每周,paperlib 会把所有 publication 为 arxiv 的论文,重新检索一遍。
2. 中文资源因为我目前还从没读过中文相关论文,所以这块没有关注到,感谢。 |
73
huntley 2022-06-24 16:15:13 +08:00
publication 好像只有 volume 没有 issue ,不知道是不是数据源的问题。
|
74
shoujiaxin 2022-06-24 16:17:16 +08:00
虽然已经硕士毕业了,但是有兴趣帮忙开发 SwiftUI 的版本
|
76
SorryChen OP @shoujiaxin 哇,感谢,如果有兴趣,可以加我 vx base64:Z2VvZmZyZXljaGVuNzc3 或者 email 我详聊哈。。
|
77
LinePro 2022-06-24 16:26:02 +08:00
@SorryChen #69
开全局代理测试了一下,似乎只有软件检查更新会走代理,scrape 并不会走 233 。 不过我个人更习惯不开全局代理,而是为有需要的软件单独设置代理。虽然用 Proxifier 之类的软件也可以,不过有内置的代理设置就更好啦( |
79
samersions 2022-06-24 16:51:56 +08:00
mark 一个,界面挺不错的。
|
80
CaptainD 2022-06-24 17:08:08 +08:00
我拖拽一篇论文进去没反应,是需要等很久么
|
81
SorryChen OP @CaptainD 你看左上角,他在转圈么,左下角,有提示在什么 scraper 抓取嘛?我猜测是不是网络不好的问题,有最大 timeout 的,如果网络不好等一会应该会有失败提示
|
82
jaylong 2022-06-24 17:12:13 +08:00
对生物领域论文匹配 meta 效果不太好,但还是要赞一下楼主的创作和分享精神。
|
83
SorryChen OP @jaylong 这个问题肯定啦。。。因为我是 CV 领域的,所以我不太知道别的领域应该去哪里找论文数据。现有的 scraper 都是我们这边领域的,像 DBLP CVF IEEE 啥的,如果你愿意贡献你们领域的 scraper 代码,欢迎提 issue ,scraper 写起来并不难,可以改造成生物版本的 paperlib ~
|
84
ttgo 2022-06-24 17:24:11 +08:00
昨天我记得只有十几二十个星,现在已经小 100 了 腻害
|
86
menc 2022-06-24 17:27:13 +08:00
请问除了 tag ,能不能支持加一些备注给 paper 呢,paper 多了有时候可能需要写一两句话备忘,比如 key idea 或者哪里有坑之类的(
|
87
SorryChen OP @menc 你的这个想法,跟我需求很像哈哈,你点开编辑,下面的 note 就是这个作用啦,我也喜欢一句话总结一个论文哈哈
|
88
CaptainD 2022-06-24 17:32:20 +08:00
@SorryChen #81 刚才应该是我拖拽的位置不对,我拖到了 folders 下面,我拖到中间位置可以下载,但是出了新的问题
PDFScraper error: MissingPDFException: Missing PDF 我拖的是一个普通的 PDF ,可以正常打开的 |
89
SorryChen OP @CaptainD 哈。。。这么奇怪的问题,感觉是读取不到你的 PDF ,你是 mac ?还是 win ?难道是权限问题?如果不介意,可以加个微信我详细排查下么? vx base64:Z2VvZmZyZXljaGVuNzc3
|
90
CaptainD 2022-06-24 17:52:48 +08:00
@SorryChen #89 这个问题我在 mac 和 PC 都发现了,可能是因为我的 PDF 名称有特殊符号导致读取失败,我改名之后可以正常读取,但超时没有找到结果,可能是因为期刊比较老了,我换了几篇其他的都能正常工作,非常感谢做出这个工具
|
91
SorryChen OP @CaptainD 哈是这样哦。。可能属于不太常见的文章题目我这里没遇到过,如果不介意的话,能分享下那个文章的名字嘛,我尽量去修复这个问题。
|
92
CaptainD 2022-06-24 18:00:43 +08:00
@SorryChen #91 是这篇文章,可能比较老了且专业差距有点大,不用太在意这个问题~
https://onlinelibrary.wiley.com/doi/abs/10.1002/%28SICI%291099-1085%28199805%2912%3A6%3C823%3A%3AAID-HYP656%3E3.0.CO%3B2-Z |
93
SorryChen OP @CaptainD 我尝试了这个论文,原因是因为它的封面上的标题,和他真正发表的标题不一样,所以,最终搜到 google scholar scraper 依旧失败了,事实上手动改成全名,然后重新 scrape 一下就搜到了。但是也让我发现了一个 google scholar 里面的 bug 就是 publication time 没搜索到,下个版本会修复。
|
94
allAboutDbmss 2022-06-24 18:45:51 +08:00
可以有一个网页版本吗?
|
95
SorryChen OP @allAboutDbmss 改网页并不难,但是网页版有一个大问题是,我不知道怎么处理和 PDF 文件的关系,因为这个软件,是和 PDF 强相关的。如果网页的话,PDF 存在哪呢,如果用 PWA 技术,我不知道这个技术的文件读取啥的功能做的如何了。
|
96
admin926 2022-06-24 18:55:05 +08:00
UI 很漂亮,支持作者,用用看,一直用的 zotero ,你不说我还没发现界面的确是丑了点,哈哈哈哈
|
98
ElsaGranger 2022-06-24 18:56:54 +08:00
可能会有 iOS 的版本吗,想在 iPad 上面做笔记
|
99
SorryChen OP |
100
c0pper 2022-06-24 19:01:08 +08:00
老哥能说一下是怎么抽时间做的?怎么我搞 cv 是赶一个会议 ddl 到赶另一个会议 ddl
|