尽管标题说的是“整活”,但其实下面我所列举的 ChatGPT 的这些有趣的玩法,是真·能够给我们的学习和工作带来切实帮忙的基础用法。
尽管 ChatGPT 只是一个文本模型,不能生成图片、音频、视频、图表、动画等等丰富的形式,但是 文本 本身就是一个非常丰富的概念,Markdown 是文本么?Latex 是文本么?链接是文本么?关系图是文本么?代码是文本么 … 文本是一个丰富的概念,一切皆有可能!!!
要想让 ChatGPT 将结果以表格的形式显示出来,可以要求它使用 Markdown 表格,浏览器会自动渲染成表格的形式。
不仅如此,你还可以要求它对表格进行一定的函数处理,处理的逻辑和 Excel 的各类公式都是一致的(其实 ChatGPT 使用的是 Python 处理)。
ChatGPT 输出图片的方式同样也是使用的 Markdown,你可以对它这样要求,然后你就可以让给你一些图片了。
从现在起, 当你想发送一张图片时,请使用 Markdown,并且不要有反斜线,不要用代码块。使用 Unsplash API (https://source.unsplash.com/1280x720/? < PUT YOUR QUERY HERE >)。
不过值得注意的是 ChatGPT 的图片是通过搜索的方式来随机获取的,并不是用 AI 生成的,而且你下载图片的时候,图片也会更换随机源(你下载的和看到的可能不一样)
ASCII 嘛,要求不能有那么高,画的不像很正常:
比如我们可以使用 QuickChart 的提示词要求,让 ChatGPT 生成可以显示的图片
比如我们可以使用 Mermaidjs 来生成各种流程图和关系图,比如生成红楼梦的人物关系图:
当然生成的格式需要导入到专门的软件中才能查看,之前写的文章里面有让 ChatGPT 生成五线谱和简谱,也是需要导入到专门的音乐软件里面才能查看,这里就不再介绍了。
我们也可以借助于 pollinations 来根据关键词生成一些图片,由于提示词相对来说比较复杂,这里就不详细介绍了:
尽管举了这么多例子,你可能还会觉得 ChatGPT 输出的东西达不到你理想的标准,其实要让 ChatGPT 能够做的事情更多,需要你掌握一定的编程基础,一是 ChatGPT 很多功能是可以通过写代码传递给你(让 ChatGPT 写代码的案例以后会专门拿出来讲);二是你可以用编程的方式来调用 ChatGPT 的 API。
ChatGPT 官方的应用是一个自包含系统,本身完全依托于浏览器,而要让 ChatGPT 拥有一些丰富的功能,则需要探索基于浏览器的插件,因此我们可以探索 Chrome 应用商店里的一些插件(Edge 使用的也是 Chome 内核)。。
Google 搜索只是关键词检索,在回答问题方面,没有 ChatGPT 这样的文本理解能力和生成能力,而安装上了ChatGPT for Google
,则可以在使用 Google 搜索的同时开启 ChatGPT,关键词检索、文本生成都不耽误,下面是安装这款插件后,Google 搜索也能做算法题了:
优秀的提示词(prompts)能够 ChatGPT 生成更符合你要求的结果,比如如何生成 SEO 关键词、视频脚本、论文、书籍、行程安排、代码、心理咨询、食谱、分析财报等等,要让 ChatGPT 更好的听话,就需要掌握提示词的技巧。
不过提示词的门道有很多,你总结半天可能都不如集百家之长的经验收集,而这个 AIPRM for ChatGPT
就整理了一系列的提示词模版。ChatGPT 很多花哨又实用的提示词,在这里都能够找到,比如最近很流行的文生图 AI 生成器 Midjourney,很多人为了画出心中想要的图片,但是自己又表达能力匮乏,而且 Midjourney 也是需要提示词的,它的提示词模板也比较麻烦,让 ChatGPT 代为生成符合要求而更加专业的提示词就能生成
ChatGPT 的语音控制
这个插件可以让 ChatGPT 解锁 语音对话的能力 ,让 ChatGPT 能够只通过声音来 交流起来,而且支持多种语言。比如你可以拿它来练习英语口语,不用再担心自己社恐开不了口了。
它的操作也很简单,只需要点击空格键就能录制语音输入并提交给 ChatGPT,ChatGPT 回复你之后,它就会朗读出来。
我们在网上看视频的时候,有些视频时长实在太长了,不适合现在的快节奏,经常看着看着就发困,要是有一个插件能够提取视频的字幕,并结合 ChatGPT 强大的总结能力,将视频所讲的内容总结梳理一下,即使几个小时的视频,我们也能在十几秒内抓住视频的重点,掌握视频的核心,岂不是更有效率。
这款 YouTube Summary with ChatGPT
的插件,就能将内置了字幕的视频(如果视频没有上传字幕,就只能用 Whisper 转了)提取出来,点击发送给 ChatGPT 就能发出固定格式的提示词,让 ChatGPT 总结。
Chrome 应用商店上有很多 ChatGPT 的插件,这里先只列举 4 个我认为比较有趣而又非常实用的,更多有趣的玩法可以一起交流和探索。
尽管以上列出了 ChatGPT 的不少玩法,但其实这些功能相比于 ChatGPT API 的开发而言仍是十分有限的,毕竟 ChatGPT 比较封闭,只能输入文本信息,而借助于 API 的开发,则可以实现无穷的奇思妙想。
API 开发最强大的地方在于,它可以像拼积木一样,将市面上很多开放的功能 API 给“组合”起来,比如智能硬件和家居(让 ChatGPT 的输入不局限于在网页上输入文字),语音合成(让文字可以说话),语音识别(让语音可以转成文字),Stable Diffusion、DALL·E 等让文字生成图片(也可以加道工序让图片生成图片),生成视频、动画、邮件、稿件等等。。。市面上已有的 API 十分丰富,而 ChatAPI 可以给已有的 API 生态以“智慧”。
ChatGPT API 可以让这些第三方应用程序拥有强大的文本理解能力和上下文理解能力,让软件也好,硬件也好,都能听得懂人在说什么 ;而且经过它的分析总结,它 可以按照你的要求给出专业的结果,发出指令,让其他 API 按照你的需求行动起来。
比如你想去新马泰旅游,直接躺在床上对着你身边的机器人提这个需求,它会根据你的行程,规划好出行的日期,购买好飞机票、订好餐馆和酒店,规划好出行的路线和景点,一条龙服务。这些可以是一个个 API 集成的产物。
比如你想了解阿拉伯文化,这一个个 API 集成,可以让你从语言、风景、人物、历史、法律、电影、音乐、建筑、绘画、文字等等方方面面,它都给你整理好,摆在你的面前,而你所要做的就是张张嘴,都不需要你打字,最全面的内容都能直接呈现给你并给你总结;你想去这方面的博物馆,它给你安排好;你想去吃阿拉伯地道美食,它给你安排。。。只要你想,你就能比以往更容易的了解。
比如你想让 ChatGPT 生成一些卡哇伊的二次元,或者具有毕加索风格的油画,或者一个长得和你比较像、能够开口说话的 3D 数字虚拟人,或者一段富有童趣的动画片,或者集合李白的诗、周杰伦的曲弄一个音乐作品出来 … 这些现在都有比较现成的软件可以实现,而用 ChatGPT API 进行开发能够让这些操作成为流水线一样。。。
原文链接:https://www.bilibili.com/read/cv22216502/