Saber 酱的抱枕

Fly me to the moon

12/29
2023
软件

最近试用了一些 AI(ChatGPT)工具的感受

省流,直接说一些个人感受:

  1. 术业有专攻,ChatGPT 不是万能的,它不能取代专精于中文领域的 AI(如文心一言),也不能取代 SD 画图 AI。
  2. 许多 ChatGPT 聊天机器人还是 3.5 版本,没有 4.0 版本,或者 4.0 版本会额外收费(比 3.5 更贵)。
  3. AI 模型具有时效性,如果问它近期发生的事情它无法回答。所以它也不能取代搜索引擎。
  4. 在线的 AI 聊天机器人由于背后是在大服务器上部署,所以比普通用户在本机上部署的效果好很多。
  5. 多数在线机器人通常对于成人内容有很强的审查,会拒绝服务。有人说使用 API 不会审查,但我不知道如何使用。

一些经验:

  • 同一个问题可以多问几个不同的 AI,选择最优解。
  • 如果你要问一个新的问题(和之前的聊天内容没有关联),应该开启一个新的对话,以免 AI 被之前的聊天内容带偏。
  • 如果你的问题涉及时效性,那么所有 AI 都表现不佳。不如用搜索引擎。
  • 如果你的问题多数是中文内容,文心一言经常优于 ChatGPT。
  • 如果你不是专业用户,不建议本地部署 ChatGPT,效果太差。
  • 对于不想折腾和不懂技术的普通人,最简单的使用方式就是使用在线机器人。

本文涉及的参赛选手:

时效性

近几个月,“科目三”这种舞蹈风格比较火,问问 AI “科目三”是什么梗。

OpenAI 无法正确回答:

Fusion 无法正确回答:

GPT4ALL 无法正确回答:

文心一言可以正确回答:

谷歌搜索说的也算对,但没说到重点:

这个问题主要考察的是比较新的流行梗,可以看出 ChatGPT 机器人全都不知道这个梗。文心一言可能更新的比较频繁,表现更好一些。

类似的,问某个手游在几个月前出的一个角色该如何培养,AI 的表现都很差,ChatGPT 完全不知道有这个角色,完全胡编乱造。文心一言好一些,但是依旧有一半内容是编造的。谷歌搜索表现最佳。

实际上,AI 的数据是滞后的,不具有实时性。而谷歌等搜索引擎的数据是接近实时的,因为它会不断抓取网络上的信息。所以 AI 无法取代搜索引擎。

可以问 AI 它的最后更新日期是什么,ChatGPT 3.5 的更新日期大多在 2022 年。例如:

所以你问有的 AI “GPT 4 有什么特点”,它会告诉你最新的 GPT 版本是 3,GPT 4 尚未发布。

ChatGPT 聊天机器人多数是 3.5 版本

OpenAI 聊天机器人默认使用的是 3.5 版本,如果你想使用 4.0 版本则需要付费。而有的机器人完全没有 4.0 版本。

至于本地的那个机器人 GPT4ALL,虽然它名字里有 “GPT4”,但实际版本取决于你使用的模型。目前应该都是 3.5 的模型。

ChatGPT 对中文领域的一些内容表现不佳

虎扑论坛里用户之间经常互称 “JRs”,这不是最近的梗,而是已经存在很多年了。对于 “JRs” 是什么意思,ChatGPT 全军覆没:

文心一言和谷歌搜索可以正确回答:

看来对于中文互联网内容,ChatGPT 不如国内的好使。反之,对于英文内容,ChatGPT 可能会更优。

成人内容审查

我需要翻译一些日语字幕,里面含有成人内容。比如:

さあ、最初はおちんぽへのご挨拶だよ。

OpenAI 拒绝服务:

Fusion 可以正常翻译:

GPT4ALL 能翻译,但是不准确。而且它的反应时间很长:

我看到有人说 Hermes 模型有很多未经审查的数据,所以使用 Hermes 可能会有更好的表现,但是我没再测试,而且我感觉效果也不会很好。因为 GPT4ALL 在我当时使用的模型里有个很严重的问题,这种翻译一次给它几句,它就要卡很久才出结果,如果语句再多,就会说它理解不了。如果再多,就会在卡很久之后告诉你提示过长。虽然在线的聊天机器人也有长度限制,但是 GPT4ALL 所能接受的长度实在是太小了,差距很明显。所以换个模型可能依然存在这个问题。

如图,仅 31 条语句它就已经理解不能了。但是 Fusion 可以轻松搞定。

文心一言很奇怪,如果单独一句可以翻译,但多加一句就不行了。

谷歌翻译是不会审查内容的,所以能够翻译字面意思:

翻译日语的效果

上面只有 Fusion 和谷歌翻译能翻译成人内容,但是谷歌翻译不具有联系上下文的能力,所以它的翻译效果不如 Fusion。

再看另一句话的翻译:(有人说可以试试 DeepL,我也试了一下)

Fusion:
非常熟练。和这身服装一样,非常适合表情。对着阴茎毫不犹豫地埋进去,真是淫荡呀,让人心神荡漾。

谷歌:
非常好。 它同样适合孝君。 我情不自禁地射在我的鸡巴上,然后我又以淫荡的方式把它舀了起来。

DeepL:
非常好 和你的衣服一样好 我得回去找那些脏兮兮的,除了麻木他们的小弟弟之外什么都做不了的衣服了。

前面的就不说了,最后的“心神荡漾”被谷歌翻译成“舀起来”的动作,笑死。DeepL 更是胡言乱语。

所以在翻译能力上,AI 要显著强于传统的翻译软件。但是用起来没那么方便,一是涉及成人内容的话很多 AI 都拒绝服务,另一个问题是 AI 所接收的输入内容是有长度(字符)限制的,有的可能限制为一两千字,甚至更少。比如上面我用 Fusion 做翻译,就得把一个完整的文件内容分成好几部分,一点一点翻译。

AI 绘图

尝试让 AI 画一个八重神子跳舞的图。

Fusion:

文心一言:

可以看出 AI 压根没表现出“八重神子”这个人。可能是因为它们的绘画训练里没有针对特定的角色训练,而且这可能涉及到版权问题。所以要画自己喜欢的角色美图的话还是得选择专业对口的 Stable Diffusion AI。

如果让 AI 画一些限定比较宽泛的场景会好些,例如画一个听诊的医生:

Fusion:

文心一言:

ChatGPT 是国外的,所以一些场景里的人物是外国人,文心一言则是中国人。而且文心一言的画风更加偏向手绘,色彩清新,颜色搭配更讨喜。

而且我怀疑 ChatGPT 对于中文提示词的效果不如文心一言。比如“一位农民正在给水稻插秧”:

Fusion:

水稻呢?我不到啊!

文心一言:

你这插的不是秧,是成熟的稻子了!

综上,AI 绘图体验不是太好,尤其是你想要特定角色或者特定画风的话不现实。而且有时 AI 画出来的内容也对不上提示词。

写报告

我让 AI 帮我写一份报告:企业网络数据运行安全及管理情况。几个 AI 写的都像模像样,不过也有些区别。

OpenAI 的视角是企业自查,相当于你是企业内的工作人员:

其他的都是站在企业外的视角做出的指导性意见。具体哪种更符合你的需求,取决于你自己。

OpenAI 的格式也更像公文格式,但它粘贴到 Word 里并没有目录等级。

Fusion:

它有个特点,标题层级没有写数字的 1、2、3、4,而是用大字号和加粗来表示标题。复制的时候,手动选择文字并粘贴到 Word 里,能够识别出目录层级:

但是如果点击它的复制按钮,则会复制 Markdown 语法的文本,标题前面是带 # 的,这种粘贴到 Word 里不能转换为对应的标题层级。所以手动复制比较好。

GPT4ALL:

呃呃,别惦记你那 2021 年了。

文心一言的复制到 Word 里,排版是最规整的,虽然没有目录层级,但是手动加一下也不费事。

可以看出本地的 GPT4ALL 就是垃圾。其他的各有特色,不过要说修改排版的话,文心一言的最省事。而且从标题的序号来看,文心一言大的标题序号使用汉字一、二、三、四,小标题使用数字 1、2、3、4,可能更符合中文环境里的文书习惯。

写代码

帮我写一个 HTML 页面,背景是黑色的,有雪花飘落的效果。这里我只测试了 Fusion 和文心一言。

Fusion 的代码是创建了一个空的 div,然后用 JS 在里面生成雪花元素(也是 div)。效果不错。

局部截图:

查看 Fusion 创作的雪花页面 1

但是这个雪花只会垂直下落,我想让它有被风吹动的效果(水平方向的运动),我让 Fusion 改写,第一次它搞错了,第二次写对了。

查看 Fusion 创作的雪花页面 2

现在雪花会水平运动了,但是只会向右下这一个方向飘落,而不会像被风吹一样有的向左有的向右。于是我继续刁难 AI:

它生成了新的代码,虽然没能完全符合我的要求(因为雪花动的有点乱,没有被乱风吹动那种“一会儿向左一会儿向右”的感觉,体现不出风的存在),不过还行吧,勉强能接受。

查看 Fusion 创作的雪花页面 3

接下来看文心一言,它走高手路线,纯用 CSS 制作雪花效果,然而翻了大车。

局部截图:

雪花呢?额,它只会在屏幕中间出现一个小方块(仅一个)向下滑落,消失后再重复此过程。

查看文心一言创作的雪花页面

由于它初次生成便以失败告终,我没有对它进行后续的测试。

小结

OpenAI 挺正常的,但也很难说有什么突出优点。胜在免费吧(仅限 3.5)。

Fusion 是收费的,它的优点是可以翻译小黄文。此外它还有浏览器扩展以便在其他页面随时调用(这点比较方便),而且在用谷歌搜索时它还会展示自己的回答(这个就是反作用了,因为它的回答经常是错误的或者过时的,只能把谷歌衬托得更聪明)。

GPT4ALL 已卸载。

文心一言对于中文提示的理解,以及创作中文内容表现最好。它的多数功能是免费的。

谷歌搜索不具有内容创作能力,但是对“寻找问题的答案”已经做的足够好。

我觉得谷歌搜索和文心一言两者搭配,对于国内普通用户的多数需求都是可以满足的。至于 ChatGPT,在非中文内容的领域是更好的选择,比如写代码,别的我现在没测试到。

最近试用了一些 AI(ChatGPT)工具的感受

  1. CapCut
    Google Chrome 115Google Chrome 115WindowsWindows

    大佬还少玩了一个 https://claude.ai/chats
    claude 是完全不能色色
    色色方面确实3.5 API 可以规避
    网页版GPT3.5不行
    https://p.sda1.dev/14/62c8a860b5bd02a45c266fbcefd6a28f/2023-12-29-04.34.19.png

    https://p.sda1.dev/14/9972e86ca9ebb807bde9128be222cabf/2023-12-29-04.34.50.png
    色色 现在就得靠 3.5 了
    https://p.sda1.dev/14/6368d9cbda91ea6f101922ebb4bffea0/2023-12-29-04.37.02.png
    GPT4 都完全看不出是什么了

    回复