GPT爬虫,GitHub 万星项目,30秒创建专属问答机器人,快速抓取网站内容|gpt-crawler | AI | ChatGPT GPTs

作者: AI煉金術分类: 软件应用 发布时间: 2023-11-24 18:14:55 浏览:42384 次

GPT爬虫,GitHub 万星项目,30秒创建专属问答机器人,快速抓取网站内容|gpt-crawler | AI | ChatGPT GPTs

浪漫的风:
强的还是gpts,这爬虫太简单,适应性很差,或者说大部分场景还是要自己写

【回复】回复 @乔治日记 :这爬虫,真的能叫爬虫吗。。。这视频就说了gpts牛逼,爬虫简单demo,剩下的所有实际业务场景,自己写
【回复】其实就是爬虫[吃瓜]套个AI的标题就开始收割了
【回复】牛逼的爬虫才是可用性的开始,自己试试这个爬虫就知道绝大多数你真正想爬的网站都爬不了
天罗雪:
G p t[笑哭]我谢谢你们,你们这样对国内发展ai有好嘛?

【回复】回复 @巫欲 :别逗了 你懂编程吗 哈哈哈哈
【回复】蒸汽机[笑哭]我谢谢你们,你们这样对国内发展工业革命有好嘛?[呲牙]
【回复】回复 @巫欲 :字里行间透出一种清澈的愚蠢
秀儿啊啊77:
能把小说网站趴下来,放在里面,让他生成我需要的小说,或者片段吗[doge]

【回复】你的想法很好[呲牙][呲牙]
eternal-echo:
gpt4好像可以直接网页检索呀,那样会差很多吗[笑哭]

【回复】你要不去看看这个项目,就是个封装了的爬虫,哪来的rag
【回复】回复 @一只有理想的指针 :狗屁知识库,就是建了个vector store而已,一个再普通不过的RAG罢了
书卷旧旧:
其实这个项目本身没用用到GPT去辅助爬虫对吗?只是用这个项目爬取内容的格式可以作为gpts的输入

来呀_快活吖:
我开好了官网4.0的 找几个人分摊费用一起用[鼓掌][星星眼]

Your_D_Daddy:
up,如果网站里有PDF,图片信息可以爬下来么?是不是还要使用orc技术识别内容

小新超人1:
为什么我点击 explore 模块要去上次 json 文件时,提示 “GPTs are gradually rolling out to Plus users” 要升级为 gpt plus 才能使用,up 你是 plus 用户吗

Matthew2023:
请教,我看这个JSON文件里,没有什么可用的内容作为知识库呀。那怎么形成知识调用的

Olaf_Chou:
为啥github上面都不说要cd gpt-crawler ,是不是看不起不懂代码的?

AI 爬虫 网站 github GPT 抓取

如果觉得我的文章对您有用,请随意打赏。您的支持将鼓励我继续创作!

更多相关阅读