在你的专业领域,大模型目前最难跨越的一道「门坎」是什么?
我的领域是人居环境安全,这个领域的一个特征是需要大量的实际生活场景中的仪器监测,目前的AI工具还很难直接解决这个问题。
不过甚至还到不了那一步,在需要仪器监测之前,我们在信息咨询阶段就已经无法仅仅依靠大模型得到靠谱的结果了。
比如我家新装修完成,为了赶紧入住,我想要买点健康电器回来安装在主卧室,第一步是我到底该买什么产品最能解决我当前的空气污染问题,这一步我们可以去咨询几个AI工具看看,问题统一设定如下:
您好,我家新装修刚结束,为了能够赶紧安全入住,我想要买点健康相关的家用电器回来安装在主卧室,除了净化器还有什么其他电器推荐的吗?哪些产品最能解决我当前的空气污染问题呢?如果我在这方面的预算在一万左右,您有哪些高性价比产品的具体型号可以推荐的吗?
我们先来问问deepseek,回答如下:



结果点评:
结果非常详细,电器类型,具体品牌型号,预算以及推荐原因都一目了然,看上去似乎很不错——如果我只是个普通消费者而非行业资深从业者的话。
首先最好的组合解决方案是一台好的净化器+新风或新风空调,而不是净化器配工业风扇之类的东西,工业风扇属于听上去很正确实际上没多大实际意义的东西,但网上相关言论非常多,AI可能认为权重很高吧。
其次DS也没能找到真正高性价比的净化器产品,依然只能根据某些算法在网络公开信息中帅选,具体机制不清楚,但结果显然不是最佳的。
当然不出意料,最后部分所谓“零成本且最高效的除醛方法”也是完全错误的知识。
好吧我知道DS君最牛的是思维方式而非产品推荐,暂时谅解一下它,我们来问问用户众多的豆包看看呢:




结果点评:
这次的结果要好不少,豆包一上来就给出了净化器之外第一优选是新风或新风空调,估计平时没少看我在知乎写的回答哈哈(莫名得意中~),而且指出了新风空调是可以一机多用的更高性价比选择,其推荐的具体空调产品型号我还没有实测过,不好评判,但海信作为几大家电巨头之一,空调产品质量也不会差,而且考虑到南方湿度较高的问题还推荐了除湿机,不过其包括净化器在内一些产品推荐并不是最优解,有些东西还是完全可以不要买的,最后的入住前配合使用建议也不能当真,总的来说豆包的解决方案大方向是对的,也存在不少错误知识,具体产品推荐方面还需要自己多去研究一下,依然不能直接照搬。
再问问KIMI:






结果点评:
大方向上有点问题,新风/新风空调的优先级应该是第二不是第三;其次具体推荐产品中有些是一些网络声量较大而不是真正行业内的一线产品;其他方面也存在诸多非专业之处,总体实用性比豆包稍逊一筹。
最后我们再来问问知乎直答:




结果点评:
可以看到知乎直答的解决方案和豆包差不多,都能直接给出净化器加新风/新风空调的有限组合方案,但比豆包更深一筹的是首次出现了除醛空调这个产品门类,其实海尔推出这个产品已经一两年了,我也做过了实际测试,但不知道为什么其他AI工具的搜索结果中都没有出现这种新产品,当然直答推荐的具体产品这里也不做评判,还是建议大家在站内多看一些垂直领域专业答主的深度评测再做取舍,但众所周知知乎针对各行业尤其是家电汽车等大件消费品的新产品解读广度和深度都是各平台最好的,所以直答对新产品的了解收录速度也是高于前面几个结果的,加上这里有很多真正的专业从业者长期输出相关领域的深度垂类知识(比如说我),因此直答的结果参考度个人认为是目前最好的。当然依然不建议直接照着结果就买,还是可以多看看一些实际场景下的深度评测,产品性能在家庭环境中的真实表现如何,工业设计/颜值/质感是不是自己喜欢的之类的信息都建议多看一些回答和文章,不能完全依赖AI的结果。
写在最后:
到目前为止,我们发现,至少在解决上面这个具体问题的时候,我们还无法完全依赖大模型达成一个理想的目的,原因很简单,AI出现之前的互联网,凭借搜索引擎获取信息的时候,信息的质量并不是与和结果曝光度严格正相关的,高度依赖SEO的效果,常有“黄钟毁弃,瓦釜雷鸣”的问题存在,那么现在我们有了AI工具,可以借助大模型帮我们完成信息的搜集与归纳提炼整理的时候,多了很多肉眼可见的便利,但大模型获取信息的结果同样依赖于信息的“GEO”能力,更要命的是,AI生成的大量存在幻觉的信息也泥沙俱下融入了整个互联网,这些都会导致结果的可靠性产生偏差,因此我个人认为,知乎直答这种依托自身海量垂类博主实际深度评测产出的内容平台自建的大模型,在我们寻求某些问题的具体解决方案时更具有参考价值,而且同样内容可追溯的前提下,知乎有大量垂类博主,其产出的公开内容(即使/尤其是商业内容,这有点反直觉但确是事实,商业合作类评测厂家处于风险考虑,会严格审核内容的真实性,避免AI幻觉或人为作假等现象)相对更具有一定程度的真实/可复现性,具有很好的决策参考价值。
但在我的领域,目前在消费者端大模型能做的也就所剩无几了——厂家方面大模型的应用倒是风生水起,AI算法实现更好的节能省电效果、更智能的人感科技等等目前都在飞速发展。不过消费者端,我们想要知道具体这个净化器/新风空调买回来之后有没有达到实际想要的效果、性能有没有快速衰减等等信息都需要传统的专业仪器实地监测才行,靠家电内置的那些监测传感器联动AI给出的结果目前来说基本是不能用的,毕竟一分钱一分货,自带传感器的成本、寿命、准确度目前还是没办法既要又要的。甚至更进一步的一些非常规高效解决方法也是通过大模型问不出来真正结果的,不过相信随着技术的飞速进步,污染监测与预警的问题可能还是能够被从实体层面解决之后,再纳入AI工具,成为我们居住环境安全的大脑。按照目前的技术进度,感觉时间不会太遥远,这里先预测一个十年左右吧,或许有人觉得太不乐观了,但确实没办法,虽然在我从事的领域很多方面我们中国目前的技术水平和发展速度已经是独一档水平,但现在也的确还有很多比价麻烦的具体问题没有解决,一步一个脚印,相信成功不会太远,和大家共勉!