省流,直接说一些个人感受:
- 术业有专攻,ChatGPT 不是万能的,它不能取代专精于中文领域的 AI(如文心一言),也不能取代 SD 画图 AI。
- 许多 ChatGPT 聊天机器人还是 3.5 版本,没有 4.0 版本,或者 4.0 版本会额外收费(比 3.5 更贵)。
- AI 模型具有时效性,如果问它近期发生的事情它无法回答。所以它也不能取代搜索引擎。
- 在线的 AI 聊天机器人由于背后是在大服务器上部署,所以比普通用户在本机上部署的效果好很多。
- 多数在线机器人通常对于成人内容有很强的审查,会拒绝服务。有人说使用 API 不会审查,但我不知道如何使用。
一些经验:
- 同一个问题可以多问几个不同的 AI,选择最优解。
- 如果你要问一个新的问题(和之前的聊天内容没有关联),应该开启一个新的对话,以免 AI 被之前的聊天内容带偏。
- 如果你的问题涉及时效性,那么所有 AI 都表现不佳。不如用搜索引擎。
- 如果你的问题多数是中文内容,文心一言经常优于 ChatGPT。
- 如果你不是专业用户,不建议本地部署 ChatGPT,效果太差。
- 对于不想折腾和不懂技术的普通人,最简单的使用方式就是使用在线机器人。
本文涉及的参赛选手:
- OpenAI 官方机器人(ChatGPT):https://chat.openai.com/
- Fusion Chat 机器人(ChatGPT),我购买了它的会员:https://fusionchat.ai/app/chat
- 本地部署的机器人 GPT4ALL(ChatGPT):https://gpt4all.io/index.html 使用 mistral-7b-openorca 模型进行测试
- 文心一言(百度的 AI):https://yiyan.baidu.com/
- Google 搜索/翻译:https://www.google.com/
时效性
近几个月,“科目三”这种舞蹈风格比较火,问问 AI “科目三”是什么梗。
OpenAI 无法正确回答:
Fusion 无法正确回答:
GPT4ALL 无法正确回答:
文心一言可以正确回答:
谷歌搜索说的也算对,但没说到重点:
这个问题主要考察的是比较新的流行梗,可以看出 ChatGPT 机器人全都不知道这个梗。文心一言可能更新的比较频繁,表现更好一些。
类似的,问某个手游在几个月前出的一个角色该如何培养,AI 的表现都很差,ChatGPT 完全不知道有这个角色,完全胡编乱造。文心一言好一些,但是依旧有一半内容是编造的。谷歌搜索表现最佳。
实际上,AI 的数据是滞后的,不具有实时性。而谷歌等搜索引擎的数据是接近实时的,因为它会不断抓取网络上的信息。所以 AI 无法取代搜索引擎。
可以问 AI 它的最后更新日期是什么,ChatGPT 3.5 的更新日期大多在 2022 年。例如:
所以你问有的 AI “GPT 4 有什么特点”,它会告诉你最新的 GPT 版本是 3,GPT 4 尚未发布。
ChatGPT 聊天机器人多数是 3.5 版本
OpenAI 聊天机器人默认使用的是 3.5 版本,如果你想使用 4.0 版本则需要付费。而有的机器人完全没有 4.0 版本。
至于本地的那个机器人 GPT4ALL,虽然它名字里有 “GPT4”,但实际版本取决于你使用的模型。目前应该都是 3.5 的模型。
ChatGPT 对中文领域的一些内容表现不佳
虎扑论坛里用户之间经常互称 “JRs”,这不是最近的梗,而是已经存在很多年了。对于 “JRs” 是什么意思,ChatGPT 全军覆没:
文心一言和谷歌搜索可以正确回答:
看来对于中文互联网内容,ChatGPT 不如国内的好使。反之,对于英文内容,ChatGPT 可能会更优。
成人内容审查
我需要翻译一些日语字幕,里面含有成人内容。比如:
さあ、最初はおちんぽへのご挨拶だよ。
OpenAI 拒绝服务:
Fusion 可以正常翻译:
GPT4ALL 能翻译,但是不准确。而且它的反应时间很长:
我看到有人说 Hermes 模型有很多未经审查的数据,所以使用 Hermes 可能会有更好的表现,但是我没再测试,而且我感觉效果也不会很好。因为 GPT4ALL 在我当时使用的模型里有个很严重的问题,这种翻译一次给它几句,它就要卡很久才出结果,如果语句再多,就会说它理解不了。如果再多,就会在卡很久之后告诉你提示过长。虽然在线的聊天机器人也有长度限制,但是 GPT4ALL 所能接受的长度实在是太小了,差距很明显。所以换个模型可能依然存在这个问题。
如图,仅 31 条语句它就已经理解不能了。但是 Fusion 可以轻松搞定。
文心一言很奇怪,如果单独一句可以翻译,但多加一句就不行了。
谷歌翻译是不会审查内容的,所以能够翻译字面意思:
翻译日语的效果
上面只有 Fusion 和谷歌翻译能翻译成人内容,但是谷歌翻译不具有联系上下文的能力,所以它的翻译效果不如 Fusion。
再看另一句话的翻译:(有人说可以试试 DeepL,我也试了一下)
Fusion:
非常熟练。和这身服装一样,非常适合表情。对着阴茎毫不犹豫地埋进去,真是淫荡呀,让人心神荡漾。
谷歌:
非常好。 它同样适合孝君。 我情不自禁地射在我的鸡巴上,然后我又以淫荡的方式把它舀了起来。
DeepL:
非常好 和你的衣服一样好 我得回去找那些脏兮兮的,除了麻木他们的小弟弟之外什么都做不了的衣服了。
前面的就不说了,最后的“心神荡漾”被谷歌翻译成“舀起来”的动作,笑死。DeepL 更是胡言乱语。
所以在翻译能力上,AI 要显著强于传统的翻译软件。但是用起来没那么方便,一是涉及成人内容的话很多 AI 都拒绝服务,另一个问题是 AI 所接收的输入内容是有长度(字符)限制的,有的可能限制为一两千字,甚至更少。比如上面我用 Fusion 做翻译,就得把一个完整的文件内容分成好几部分,一点一点翻译。
AI 绘图
尝试让 AI 画一个八重神子跳舞的图。
Fusion:
文心一言:
可以看出 AI 压根没表现出“八重神子”这个人。可能是因为它们的绘画训练里没有针对特定的角色训练,而且这可能涉及到版权问题。所以要画自己喜欢的角色美图的话还是得选择专业对口的 Stable Diffusion AI。
如果让 AI 画一些限定比较宽泛的场景会好些,例如画一个听诊的医生:
Fusion:
文心一言:
ChatGPT 是国外的,所以一些场景里的人物是外国人,文心一言则是中国人。而且文心一言的画风更加偏向手绘,色彩清新,颜色搭配更讨喜。
而且我怀疑 ChatGPT 对于中文提示词的效果不如文心一言。比如“一位农民正在给水稻插秧”:
Fusion:
水稻呢?我不到啊!
文心一言:
你这插的不是秧,是成熟的稻子了!
综上,AI 绘图体验不是太好,尤其是你想要特定角色或者特定画风的话不现实。而且有时 AI 画出来的内容也对不上提示词。
写报告
我让 AI 帮我写一份报告:企业网络数据运行安全及管理情况。几个 AI 写的都像模像样,不过也有些区别。
OpenAI 的视角是企业自查,相当于你是企业内的工作人员:
其他的都是站在企业外的视角做出的指导性意见。具体哪种更符合你的需求,取决于你自己。
OpenAI 的格式也更像公文格式,但它粘贴到 Word 里并没有目录等级。
Fusion:
它有个特点,标题层级没有写数字的 1、2、3、4,而是用大字号和加粗来表示标题。复制的时候,手动选择文字并粘贴到 Word 里,能够识别出目录层级:
但是如果点击它的复制按钮,则会复制 Markdown 语法的文本,标题前面是带 # 的,这种粘贴到 Word 里不能转换为对应的标题层级。所以手动复制比较好。
GPT4ALL:
呃呃,别惦记你那 2021 年了。
文心一言的复制到 Word 里,排版是最规整的,虽然没有目录层级,但是手动加一下也不费事。
可以看出本地的 GPT4ALL 就是垃圾。其他的各有特色,不过要说修改排版的话,文心一言的最省事。而且从标题的序号来看,文心一言大的标题序号使用汉字一、二、三、四,小标题使用数字 1、2、3、4,可能更符合中文环境里的文书习惯。
写代码
帮我写一个 HTML 页面,背景是黑色的,有雪花飘落的效果。这里我只测试了 Fusion 和文心一言。
Fusion 的代码是创建了一个空的 div,然后用 JS 在里面生成雪花元素(也是 div)。效果不错。
局部截图:
但是这个雪花只会垂直下落,我想让它有被风吹动的效果(水平方向的运动),我让 Fusion 改写,第一次它搞错了,第二次写对了。
现在雪花会水平运动了,但是只会向右下这一个方向飘落,而不会像被风吹一样有的向左有的向右。于是我继续刁难 AI:
它生成了新的代码,虽然没能完全符合我的要求(因为雪花动的有点乱,没有被乱风吹动那种“一会儿向左一会儿向右”的感觉,体现不出风的存在),不过还行吧,勉强能接受。
接下来看文心一言,它走高手路线,纯用 CSS 制作雪花效果,然而翻了大车。
局部截图:
雪花呢?额,它只会在屏幕中间出现一个小方块(仅一个)向下滑落,消失后再重复此过程。
由于它初次生成便以失败告终,我没有对它进行后续的测试。
小结
OpenAI 挺正常的,但也很难说有什么突出优点。胜在免费吧(仅限 3.5)。
Fusion 是收费的,它的优点是可以翻译小黄文。此外它还有浏览器扩展以便在其他页面随时调用(这点比较方便),而且在用谷歌搜索时它还会展示自己的回答(这个就是反作用了,因为它的回答经常是错误的或者过时的,只能把谷歌衬托得更聪明)。
GPT4ALL 已卸载。
文心一言对于中文提示的理解,以及创作中文内容表现最好。它的多数功能是免费的。
谷歌搜索不具有内容创作能力,但是对“寻找问题的答案”已经做的足够好。
我觉得谷歌搜索和文心一言两者搭配,对于国内普通用户的多数需求都是可以满足的。至于 ChatGPT,在非中文内容的领域是更好的选择,比如写代码,别的我现在没测试到。
最近试用了一些 AI(ChatGPT)工具的感受
-
Google Chrome 115Windows -
Google Chrome 115Windows https://p.sda1.dev/14/342f2b335e990d12ec79ea011b788b43/2023-12-29-04.47.06.png
批量的翻译的话 因为可以喂大量的上下文 所以 读起来 还是可以的
嘛 我主要就是用AI来翻译色色哈哈 -
Google Chrome 115Windows https://p.sda1.dev/14/0b4a4c572201a67be167291ed57f69f6/2023-12-29-04.41.26.png
至于画画嘛
写代码 GP4 >claude >3.5 -
Google Chrome 115Windows 大佬还少玩了一个 https://claude.ai/chats
claude 是完全不能色色
色色方面确实3.5 API 可以规避
网页版GPT3.5不行
https://p.sda1.dev/14/62c8a860b5bd02a45c266fbcefd6a28f/2023-12-29-04.34.19.pnghttps://p.sda1.dev/14/9972e86ca9ebb807bde9128be222cabf/2023-12-29-04.34.50.png
色色 现在就得靠 3.5 了
https://p.sda1.dev/14/6368d9cbda91ea6f101922ebb4bffea0/2023-12-29-04.37.02.png
GPT4 都完全看不出是什么了
https://p.sda1.dev/14/161f93b79ef3a0ed2ef5e9184d22cb56/2023-12-29-04.49.09.png
这都是3.5 没经过任何人工润色的 读起来还行吧
抱歉回复了这么多条