GPT爬虫，GitHub 万星项目，30秒创建专属问答机器人，快速抓取网站内容｜gpt-crawler ｜ AI | ChatGPT GPTs

作者: AI煉金術分类: 软件应用发布时间: 2023-11-24 18:14:55 浏览:42384 次

浪漫的风:
强的还是gpts，这爬虫太简单，适应性很差，或者说大部分场景还是要自己写

【回复】回复 @乔治日记 :这爬虫，真的能叫爬虫吗。。。这视频就说了gpts牛逼，爬虫简单demo，剩下的所有实际业务场景，自己写
【回复】其实就是爬虫[吃瓜]套个AI的标题就开始收割了
【回复】牛逼的爬虫才是可用性的开始，自己试试这个爬虫就知道绝大多数你真正想爬的网站都爬不了
天罗雪:
G p t[笑哭]我谢谢你们，你们这样对国内发展ai有好嘛？

【回复】回复 @巫欲 :别逗了你懂编程吗哈哈哈哈
【回复】蒸汽机[笑哭]我谢谢你们，你们这样对国内发展工业革命有好嘛？[呲牙]
【回复】回复 @巫欲 :字里行间透出一种清澈的愚蠢
秀儿啊啊77:
能把小说网站趴下来，放在里面，让他生成我需要的小说，或者片段吗[doge]

【回复】你的想法很好[呲牙][呲牙]
eternal-echo:
gpt4好像可以直接网页检索呀，那样会差很多吗[笑哭]

【回复】你要不去看看这个项目，就是个封装了的爬虫，哪来的rag
【回复】回复 @一只有理想的指针 :狗屁知识库，就是建了个vector store而已，一个再普通不过的RAG罢了
书卷旧旧:
其实这个项目本身没用用到GPT去辅助爬虫对吗？只是用这个项目爬取内容的格式可以作为gpts的输入

来呀_快活吖:
我开好了官网4.0的找几个人分摊费用一起用[鼓掌][星星眼]

Your_D_Daddy:
up，如果网站里有PDF，图片信息可以爬下来么？是不是还要使用orc技术识别内容

小新超人1:
为什么我点击 explore 模块要去上次 json 文件时，提示 “GPTs are gradually rolling out to Plus users” 要升级为 gpt plus 才能使用，up 你是 plus 用户吗

Matthew2023:
请教，我看这个JSON文件里，没有什么可用的内容作为知识库呀。那怎么形成知识调用的

Olaf_Chou:
为啥github上面都不说要cd gpt-crawler ，是不是看不起不懂代码的？

AI 爬虫网站 github GPT 抓取

如果觉得我的文章对您有用，请随意打赏。您的支持将鼓励我继续创作！