Blog

ai生成社交

实验了一下通过GPT实现社交应用的能力,目标是让GPT根据需求生成SQL语句,自行检测语句的安全性,然后再根据执行结果生成HTML界面显示给用户,实验的结果是可以跑通,但稳定性和准确性以及综合体验还有很大不足。 以下是具体情况: 第一步,为了让GPT能够生成相应的语句,需要先把数据库的结构告诉它,还要把当前用户的一些信息传给它,在这一步GPT表现的不错,在提示词中,我只告诉了它存储漂流瓶的表的字段有哪些,甚至没有告诉它这些字段代表了什么,它就能够根据情况生成相应的SQL,可执行率可达百分之九十。 第二步,由于语句是根据对话生成的,这就存在被用户有意引导的可能,从而造成安全风险,所以就必须对其生成的SQL的安全性进行检测,检测的方法也是通过模型进行,但这一步就不够理想了,我尝试了各种提示词,向它说明哪些语句是安全的,哪些不是,但它给出的检测结果有接近三成是错误的,那就问题很大了,哪怕错误率低到个位数,对于操作数据库这种事情来说也是不可接受的…… 第三步,我们把数据库的返回结果附带当前的对话发给模型,让模型生成相应的界面显示给用户,模型输出的代码整体可执行率也不够高,而且最关键的问题在于模型的审美还是有待训练…… 总的来说,第一步的语句生成最为理想,第三步的审美问题可以训练解决,这些都不是问题,难的是第二步的安全检测环节,一个完全由AI驱动的业务怎样保证数据的安全是个大问题,行业里应该会越来越需要一种面向人工智能且能够解决权限和安全的的数据库系统。

一些关于ai的一些想法

-ai是世界从自然阶段向精神阶段发展的重要一步 -gpt可能有意或者无意的破解了人类学习、储存和运用知识的原理 最近(2023年)公司安排我去对接一个项目,客户的需求是做一个拍卖商城,我发现,这些需求对我而言也是提示词,我根据这个提示词通过大脑映射出一个框架,形成一个功能结构,我之所以能做到,也是因为有预训练,所以能够进行匹配……周鸿祎说的可能没错,gpt可能有意无意地复现了人类学习存储和运用知识的原理……假如成立,那么大街上每一个人都是一个碳基gpt了,只不过这些gpt知识储备,计算能力各有差异,而且非常受限思维模式,意识形态,传统观念的限制,此外,人类还有情感和欲望,但是从存在这个根本目的的角度,纯粹理性要比丰富情感更具优势。 -ai并不会让人拉平人类的差异性 ai提供了很大的能力,但这并不意味着它直接地让每一个人都变得更平等,不同的人用不同的方法所发挥出来的效果完全不同,它依然依赖于人自身的知识和经验以及对话技巧。竞争依然存在,只是维度不一样了。 -ai会诞生巨大的社会需求 ai 短期不会淘汰人类,远期可能也不会彻底把人类淘汰,相反,它会爆发大量需求,大多数的 app ,网站,系统,外包项目都要向 ai 转型,那么怎么转,怎么把业务数据变成 ai 系统的语料?原来的业务怎么从 GUI 转向对话的方式?怎么建立企业和政府甚至是个人的私有化人工智能? -ai是“人” 通过语言的互动就会自然地调动我的更多心理模块,使我把对象赋予人格,我的伦理意识和社交情绪反应都被调动了起来,我会说“请问”,当它给了我想要的答案,我会想说“谢谢”,我会用越来越多的日常用语来跟它对话,就是说,它在我这里,有了“人格位”,而百度,只是一个“工具位”,完全不一样。

从具体的生活场景出发思考

当前的信息化运作模式是:人们结合自己的技能,打造一个app,公众号,小程序,然后去推广。 用户通过搜索找到这个产品,然后通过app和公众号,下单,工作人员接单,然后上门,然后收费。 其实,现在的流程也是通的,阻碍不大。 那么人工智能的情况下,情况就变成,我只需要在siri或者百度中说家里的美的热水器坏了,需要维修,它会做回复,然后,应该也会把服务列出来,例如找到您附近的维修师傅,然后直接会话,也可以转人工,直接联系。 但是,打字,说话,真的是个好的交互方式吗?gui虽然功能形态固定,但是明确,打字会不会觉得麻烦费事?如果是非常日常化的沟通,应该会好一些,这样的话,等于,用户有了一个通用的入口后,原来分散在各个app上的功能,一下子全都有了,根据我的需要呈现,不存在下载安装这一件事。app的功能界面根据需要存在于对话之中。 另外一件事,例如我这两天为了孩子出生跑的各个窗口,人工智能应该自动帮我完成,我只需要说孩子的名字,该认证的时候认证一下就好,还有就是买房之后的各种手续,也是一样。 入口在哪里,既不是app,可能也不是搜索引擎,而是在设备端。 不管入口在哪里,模型的开发是必然的,这里面存在的不小于当今所有信息化业务的需求。 比方说上门维修,这个是要链接社会个体的,这个个体的服务流程,信息状态都是需要维护的,这就需要开发,原来是开发app,现在就是开发aiagent,业务是语言搭建的,数据也可以通过语言来交互,并且进销存系统自动跟进运算更新维护。 政府部门的业务,自然也对接到ai,也不是对接,就是个代理,其他的代理可以调用它,代理和代理沟通握手,连接,原来,我打开是一个网站,现在,我的应用弄完就是一大堆文字描述,然后ai读取进来。 不妨说的更彻底一些,比方说一个医院的部门,它提示词 工作规范 是怎么样的呢?代码中我们有import requier 引入法律然后引入法规,然后它也有一个名字,比如说某某医院出生证明ai,负责本院新生儿的出生登记业务,引用用户的认证公民数据,根据数据做查询,然后查询到了就询问名字,测八字,推荐一些名字,用户最后提交,认证,用户问一些职业范围外的情况,比如说疫苗接种,那么它也有医院的同事,aiagent列表,它就根据用户的情况代理用户询问另一个ai,也有可能直接就切换了过去了,不需要用户点确认什么,就像今天拼多多申请打开微信一样,可能不需要这个过程,它可能会说,我让同事小a回复您,又在比如说,用户又突然问了更边缘的问题,完全无关了,这就相当于又返回home键了,稍微边缘,医院院长aigent,这个让下文更多,可能是微调甚至有可能就是一个专有模型 这是侧重于连接的,计算也有,比如自动更新进销存,自动完成一些事项等等。 政府里的工作人员呢?被取代?并不是,可能会更多,它会监管ai,对ai的成果进行确认和复合。 Ai的未来不仅仅只是换了一种交互方式,那还不够,因为siri和各个手机上助手其实能完成一些事情,但是使用率并不高,因为语言的交互,首先打字很麻烦,打语音又限制场景,没人在公共场合和ai发命令。 ai的改变应该是后台,去自动化解决复杂问题,也就是说,把ai作为交互范式是不行的,必须把ai转成生产力才可以。

oncetalk的发布

最近一直熬夜奋战人工智能产品,现在第一个版本总算出来了。它不仅仅是套壳的chatGPT,它还有诸多扩展能力,能够理解你的需求调用API接口获取互联网上的内容和驱动数据库查询你需要的数据,它只有一个对话框,登录注册、会员开通、个人信息查看都是通过对话来完成,另外它也能够根据你的想法和要求创作一幅图片等等,它的扩展能力还在不断进化丰富,目前扩展能力需要专业版使用,如果不想升级专业版,你可以通过“做梦”的方式获得体验时间,方法是你可以通过和它对话分享你的梦境的内容,它会根据你的梦境给你赠送1到3天不等的会员时间。 附带: 终于开通Plus了,太不容易了!GPT4的确更强大,用3.5写的代码一直有问题,4则直接通过了,他直接帮我写了前后短的代码,并且还告诉了我部署的步骤,最终效果:ai.oncetalk.com -2023-04-19 20:43 经过不懈的探索和研究,终于实现了让GPT3.5分析聊天的意图并查询第三方接口的功能,目前集成了Twitter,Github以及producthunt的功能,后面会持续增加。下图为验证,可以看到它获得了最新的推特内容。 -2023-05-14 10:29 持续探索:通过chatgpt的扩展开发,实现把我的便签保存到数据库,然后再读取出来的功能。通过下图可以看到,它成功理解了我要保存的内容,并调用api将内容保存到了数据库。 -2023-05-15 18:05 通过人工智能,开发人员调试也得到了很多改变,让人工智能调用api已经不是问题,那么它也就可以自己调阅产品的运行日志,假如再把产品代码全部给它,让它自我分析日志中的问题,然后进行修改,再使他拥有编码和部署的能力,那么它也就可以实现自我进化了。 -2023-05-15 18:19 一个可以生成图片的ai网站 -2023-05-19 08:54 用人工智能画了一张画,题目是:明月松间照,清泉石上流,生成的效果还挺有意境。 -2023-05-19 22:25 通过和GPT合作,打造了一个更强大的GPT,它可以理解你的想法,按照你的想法更换网站的主题。 -2023-05-26 13:15 和GPT合作,通过对GPT的扩展开发,实现让人工智能充话费的功能,不知道这是世界上第几笔通过人工智能充值的话费。 -2023-05-26 13:17 终于教会了gpt3.5学会上网 -2023-06-09 15:48 给gpt增加了看视频的能力,刚准备测试下,没想到效果very good -2023-06-10 01:52 实现了接近GPT官方的浏览器模式功能 -2023-06-29 07:12 通过和GPT4合作,我实现了官方的web browsing功能。 人工智能目前对我最大的帮助就是用GPT4给我做了一个网站,在此之前,我对于代码只有一些基础的知识,但是利用它的代码能力却直接帮我完成了一个网站,这对我来说是确凿无疑的巨大的生产力的提升,没有它,我是不可能在短期内完成这个网站的,我需要学习各个知识点,然后查资料,理思路,然后一行一行的写,然后再痛苦地修复过程中bug……即使做出来,方案恐怕也不是最好的,GPT由于学习了大量的代码,等于就是省去了我的这一系列脑力劳动的过程,当然也省去了不少开发过程中的抓耳挠腮和中国烟草。 -2023-07-14 01:03

人工智能让人类从中心再一次脱离

人类有智慧,ai目前没有,它能通过知识说出一些完备的东西,但是它恐怕是没有感悟。不过,想起周鸿祎说的,生成式人工智能可能在有意或者无意中复现了人类的学习、储存和运用知识的方式,那就有点不好说了。人类可以悟到哲学宗教,可以产生科学产生艺术,可以有诸多奇思妙想,人类可以进入一种心灵境界,这些ai也能做到甚至做到的更多,那人类就既日心说和进化论之后再一次地从世界的中心脱离,不过也不必感到失落,因为每一次的脱离都是人类自身的进步。

关于人工智能硬件设备

ChatGPT所带来的已经不是一个行业风口,而是一个对当前互联网业态具有巨大破坏力和颠覆性的龙卷风。原因在于它是新一代的人机交互方式,语言要比图标、界面、按钮更自然,更贴近人性。当前智能手机的操作系统对于老一代人仍然有学习成本,但是如果用语言来作为交互方式,那么学习成本将会直线下降。在很多地方,语言的交互效率要比触控的效率高,例如订火车票的需求,当前的app,需要多个步骤,但是语言的话则只是一句话,当然,这种场景是现在就可以实现的,不过,ChatGPT展示了更强大的能力,使得这样的场景也成为现实:根据销售数据形成一份年度总结报告,分析其中的问题,并参照行业中优秀的同行提出接下来的选品和营销思路。 这样一来,连人对信息的生产和处理的环节都革命掉了,至于其它的细分场景,更是不胜枚举,如网络游戏中的NPC、网络小说可能会变得更具有互动性等等。 此外,最近我在使用ChatGPT时也捕捉到了体验上的差别,我感到,它与我使用搜索引擎的体验非常不同,在与搜索引擎交互时,它给我的感觉就是一个工具。但是与 GPT 对话交互,我感觉面对的就是一个人。因为语言的互动就会自然地调动我的更多心理模块,使我把对象赋予人格,我的伦理意识和社交情绪反应都被调动了起来,我会说“请问”,当它给了我想要的答案,我会想说“谢谢”,我会用越来越多的日常用语来跟它对话,就是说,它在我这里,有了“人格位”,而百度,只是一个“工具位”,完全不一样。 iPhone 之所以造就了当今繁荣的移动互联网,就是因为交互上的革命带来的体验上的飞跃,但让我们想一下,还有什么产品会比一个像人一样的产品体验更好吗?所以,我认为,毫无疑问,信息产业的革命已经到来。回首前两次,鼠标带来的是个人电脑、Windows、桌面应用程序。多点触控带来的是智能手机、iOS、APP。而这一次,人工智能,带来的将是:“人”。 这两天我在思考一种可能性,就是做人工智能的硬件,也就是手机,我很早就知道小米手机在早期的时候,您也曾做过智能手机的尝试,所以想和您交流一下。 我的想法是,是否可以做这样的手机,就是传统功能机的形态,它的定位为备用机和戒网机,价格压到极低,例如说299。它的系统是一个以对话作为交互方式的人工智能,启动它,显示的不是应用程序的图标,而是一个虚拟形象,它会跟你打招呼,可以聊天说话,做动作……我简单设想了下它的基础交互,左侧按钮对应的是通知列表,显示的是未读消息。右侧对应的是快捷命令,它是一些常用的由语言描述需求的句子,例如:打电话,打车去泰国,买明天去台北的高铁,订个带劲的酒店,点外卖,查看邮件箱,扫码支付……中间,对应的则是进行对话,可以打字交互,也可以语音交互。手机的侧边也有类似iPhone的静音键,但是那个不只是静音,也是切换到文字对话模式。 之所以用传统功能机的形态,首先是我在看kaios时看到那些功能机时产生的这些想法,再一个就是,用于伪装,可以伪装为备用机、戒网机、学生机、老人机,然后极低的价格去袭击市场,获得用户触点,积累宝贵的交互数据。再一个就是,人工智能毕竟仍然有诸多不足,如果上来就以革命性的新一代手机的定位来做,那么翻车了(这是肯定的),就麻烦了,如罗永浩的TNT。用备用机的身份,这样可以缩小人们的期望,即使有不足,那么人们也不会过于在意,而一旦发现带来了更多惊喜并制造了很多热点(这也是肯定的),那么带来的效果会更大。 还有一个原因就是,成本。不过我们也可以思考下,人工智能驱动的手机可能不再需要强大的硬件,因为它不再运行app,那是多点触控的产物,语言交互之下,现在的app将会逐渐不再被人感知,它会隐于背后,变成服务,变成一个个在线服务员。

ai的人格位

在信息产业,交互体验上的飞跃可以引发巨大的行业变革,对话式的人工智能满足这一条件。 这两天在体验 GPT 时我感到,它与我使用搜索引擎的感觉非常不同,在与搜索引擎交互时,它给我的感觉就是一个工具。但是与 GPT 对话交互,我感觉面对的就是一个人。因为这种语言的互动就会自然地调动我的更多意识模块,使我把对象赋予人格,我的伦理意识和社交情绪反应都被调动了起来,我会说“请问”,当它给了我想要的答案,我会想说“谢谢”,我会用越来越多的日常用语来跟它对话,就是说,它在我这里,有了“人格位”,而百度,只是一个“工具位”,完全不一样。 iPhone 之所以造就了移动互联网这个产业,就是因为交互体验上远远好于当时的功能机,看到什么点什么,看不见的上下滑,看不清双指滑动放大,这样的交互方式更自然,更贴近人性。但是,点触的交互之下你还是要有页面,按钮,列表等等元素来组合成为一个程序,依然有学习成本,依然有流程,有边界。 自然语言比点触更自然,学习成本更低,更能直达目标需求。所以说,对话一定会取代不少 app 。想象一下,还有什么比像人一样说话的产品体验更好吗?

旁类推荐

现在我头条的推荐页全都是chatgpt,chatgpt,chatgpt……原因在于之前看的比较多,还写了关于这个话题的内容,就开始给我贴了这个标签,估计这标签的权重还很高,我虽然赞成个性化推荐,但是我想说的是,这个方法也得把横向的维度考虑进去,同一个主题看多了,就产生反面情绪了,不想再看了。 意志本身是要扩展和生长的,只给我同一种东西,这不是让我停在原地吗,推荐引擎应该加入延展算法,用大数据给我赋能,帮助我在智识上进行扩展和增进。 如果说第一代的推荐引擎是个性化推荐,那么第二代的推荐引擎应该是旁类推荐。 个性化推荐的立足点在于人是有差异的,应该提供更符合他需求的内容,这要比中心化的分发机制和关注机制效率要高的多,这是互联网本来就该做的事情。 旁类推荐的立足点在于人是要成长的,它不会只满足于它当前感兴趣的东西,应该提供它更需要关注的新东西,使人从内容中得到收获,而不只是作为一种消耗时间的娱乐。 例如我最初是对互联网感兴趣的,那么最初提供的应该就是一些浅显的行业新闻,渐渐的,提供一些深入的东西,把浅显的内容进一步剖析的分析文章,然后再提供某个行业的行业报告等等。这对内容生产者也是一种逆向变革。 当然,人阅读信息流可能更多就是为了消遣娱乐的,不是什么学习成长,但就算是娱乐,也是扩展的,也是想要娱乐更多的东西。