人工智能行業(yè)正式開(kāi)啟了大數(shù)據(jù)驅(qū)動(dòng)時(shí)代
聚象科技對(duì)關(guān)于目前人工智能行業(yè)的一些問(wèn)題。
一、大數(shù)據(jù)、ChatGPT以及AIGC的關(guān)系
大數(shù)據(jù)是指讀取海量數(shù)據(jù)、參數(shù)規(guī)模巨大的算法模型。業(yè)界一般認(rèn)為超過(guò)千億級(jí)參數(shù)即為大數(shù)據(jù),其訓(xùn)練過(guò)程中可能使用了上千張以上的GPU/CPU芯片。ChatGPT與AIGC均為大數(shù)據(jù)的應(yīng)用場(chǎng)景之一。ChatGPT可以類比原有的對(duì)話式AI應(yīng)用、AI賦能的搜索類應(yīng)用。AIGC則可以分為生成文本、生成圖像、生成視頻,也可以歸為大數(shù)據(jù)的應(yīng)用場(chǎng)景之一。
二、ChatGPT-4為代表的大數(shù)據(jù)的變革
OpenAI自發(fā)布GPT1.0模型之后,一直在持續(xù)迭代,陸續(xù)發(fā)布GPT2.0、GPT3.0和GPT 3.5,本次發(fā)布GPT4.0是其持續(xù)投入AI大數(shù)據(jù)的必然階段。相比前幾個(gè)模型,GPT-4的參數(shù)量更大,模型迭代時(shí)間更長(zhǎng),也能夠給出更準(zhǔn)確的結(jié)果。新版本的發(fā)布是大數(shù)據(jù)循序漸進(jìn)發(fā)展的必然成果。正如百度李彥宏所說(shuō):“公司每一年都會(huì)發(fā)布大數(shù)據(jù)的新版本,是多年努力的自然延續(xù)”。
三、ChatGPT可能帶來(lái)的產(chǎn)業(yè)影響
ChatGPT實(shí)質(zhì)是對(duì)話式AI的應(yīng)用,對(duì)話式AI的落地已經(jīng)非常廣泛。根據(jù)IDC追蹤的人工智能市場(chǎng)規(guī)模數(shù)據(jù),對(duì)話式AI市場(chǎng)規(guī)模在2022年達(dá)到54.6億元人民幣,其市場(chǎng)滲透率相對(duì)已經(jīng)飽和。ChatGPT引發(fā)的浪潮促使主流廠商在其對(duì)話式AI應(yīng)用中引入大數(shù)據(jù),將帶動(dòng)對(duì)話AI相關(guān)市場(chǎng)新一輪增長(zhǎng)。此外,在搜索、營(yíng)銷場(chǎng)景中,ChatGPT類型的應(yīng)用則可能衍生出全新的產(chǎn)品形態(tài)。
四、引發(fā)的AI行業(yè)改革
過(guò)去幾年部署的AI應(yīng)用,接下來(lái)幾年都有可能被基于大數(shù)據(jù)的AI所替代。升級(jí)迭代可能會(huì)從優(yōu)先具備海量數(shù)據(jù)的場(chǎng)景開(kāi)始。當(dāng)大數(shù)據(jù)支撐的AI應(yīng)用成為主流,不能利用大數(shù)據(jù)能力的廠商將失去競(jìng)爭(zhēng)優(yōu)勢(shì)。未來(lái)的工作中,AI助理將替代更多人類的工作。諸如文生圖的應(yīng)用,諸如各領(lǐng)域初級(jí)內(nèi)容的搜索,均可以借助AI生成的內(nèi)容。
五、可能的投資規(guī)模
目前已經(jīng)公開(kāi)的大模型諸如GPT系列、Bert系列所耗費(fèi)的算力根據(jù)公開(kāi)資料可以查到。而真正落地到產(chǎn)業(yè)界,具體的投資規(guī)模要視應(yīng)用場(chǎng)景決定。投資成本與所需的算力,是否部署完整的大模型,以及要推理的數(shù)據(jù)流量相關(guān)。
六、新一代AI需要注意的問(wèn)題
生成式AI生成內(nèi)容的版權(quán)需提前規(guī)劃。生成式AI讀取海量數(shù)據(jù)后生成的圖片等內(nèi)容有可能會(huì)引起版權(quán)問(wèn)題,需要提前從規(guī)則上加以控制。對(duì)原有流程的改變:一方面生成式AI生成的內(nèi)容還需要人類審核才能發(fā)布,另一方面可能會(huì)要求工作流程上做出改變以適配AIGC的加入。
鑒于其仍處于技術(shù)成熟度的早期階段,在傳統(tǒng)行業(yè)應(yīng)用場(chǎng)景不十分清晰,投入產(chǎn)出比目前也難以評(píng)估。