V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  rizon  ›  全部回复第 5 页 / 共 51 页
回复总数  1011
1  2  3  4  5  6  7  8  9  10 ... 51  
op 这个产品应该是收集一批网页地址,然后服务器后台截图录入的吧。
350 天前
回复了 rizon 创建的主题 OpenAI chatgpt 代理选哪个国家合适
@ugvfpdcuwfnh #1 是 我 openai 号上还有钱呢,感觉也不好申诉了。
但是香港网速肯定比新加坡好吧,我还有些其他需要部署海外的服务没想好放哪个国家合适
@lekai63 这个有点意思啊,本身是做检测但是顺便就当了代理用。这家真的靠谱吗,就这么免费给用了啊
说到一键登录我倒有个问题啊,
我原本以为运营商没有给明文号码,只是给了个掩码和一个用户 id 。
但是看了下文档他们通过 sdk 直接从运营商拿到明文手机号。这样的话随便一个 app 不就都可以随时拿手机号了吗。运营商就这么随手就把我们卖了?都不问同不同意?
不能理解
@good4you 我的操作是由地址栏的 ominbox 触发的,没法这样搞了。
文章挺好的。

顺便随手感慨一句:js 这种语言果然可读性很差啊,ts 也就好个些许。python 这种缩进型的读起来也是痛苦。
单说阅读,在各种语法糖的加持下,需要更多的理解消耗。有时候不能做到一眼扫一下就看完的效果。还需要脑内加工一下。
就随便感慨一句。
@DTCPSS #10 这个看着蛮好用的诶,感谢兄弟。 火狐真棒,哈哈
@FrankAdler #7 对对对,就是这个思路,那些各类网页阅读器的思路。我试试这个如何
我本以为正文提取的库挺多的,结果查了一下发现,这条路好像还没有趟的很好啊。目前看到一个最简单的方法就是基于标签的密度。
@tikazyq #18 其实也有一个选择就是换更大上下文的模型,这个方法是最简单的,moonshot 的 32K 和 128K 的上下文也基本够用了。不过价格高了不少
@tikazyq #18 哈哈,我也是这么想的,分段面临的就是如何保障语义不被拆分,以及每个段落丢失上下文导致准确率下降的问题。
因为对这个东西好奇,就琢磨了一下,也自己在写一些方法测试效果。
有点好奇正文内容提取是怎么借助 AI 来做的,如果把一个页面的内容全部给 AI 来解析,token 数就太大了,消耗有些大。但是如果要缩短内容或者提取框架给 AI ,那又导致 AI 无法合理的判断正文区域。

这个事情真的很奇怪啊,难道真的只能全文提供给 AI ?感觉成本有些高啊。
@Andim 我原本也是这么觉得,但是我测了一下这个 ip 写什么都无所谓,参数不起作用。试了好几种写法都没用。就不纠结它了
@McreeWu 换成 glider 了,文章删除重写了: https://mp.weixin.qq.com/s/rDX86ej7B-_hKYq5ED2L3A
361 天前
回复了 rizon 创建的主题 程序员 求助,微信机器人用什么实现最靠谱
@TimeRain #7
@YaD2x #5 但市面上有很多 app ,都提供了微信号助手用来接收消息。那大家都是这样用各种方法绕开?
361 天前
回复了 rizon 创建的主题 程序员 求助,微信机器人用什么实现最靠谱
@sentinelK #1 我描述的可能有些误导,我不是想创建 机器人 bot ,机器人 bot 是企业内部用的。我是想让非企业用户添加这个微信号之后,给这个号发消息
@cirzear #16 dante 有些不好用,换了评论区里推荐的 glider 。 这是新文章链接: https://mp.weixin.qq.com/s/rDX86ej7B-_hKYq5ED2L3A
@Andim #4 感谢,glider 用起来确实蛮方便的。
不过我有一个疑问,我如果想把代理的请求转发到指定的 ip 怎么办呢,我试了 forward 的几个写法都没对
362 天前
回复了 chanChristin 创建的主题 Arc arc 浏览器发布新的 AI 功能
还没用,看了下视频挺不错。
不过更羡慕的是这样一群团队,去有激情的做这些事。
我也想组个或加入一个这样的团队
想咨询下 OP 啊,Crawlab AI 的在线服务支持反爬虫吗,是拥有大量 IP 来避免网站的反爬虫吗?
1  2  3  4  5  6  7  8  9  10 ... 51  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1981 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 25ms · UTC 14:31 · PVG 22:31 · LAX 06:31 · JFK 09:31
Developed with CodeLauncher
♥ Do have faith in what you're doing.