日經訪問:日本AI研究第一人這樣評價Deepseek
中國初創企業DeepSeek(深度求索)開發的高性能、低成本生成式AI(人工智慧)大規模語言模型(LLM)受到了全世界的關注。日本經濟新聞(中文版:日經中文網)就如何評價該公司的最新AI模型、安全性方面的風險、以及對日本企業的影響等問題,採訪了日本AI研究領域的第一人、東京大學教授松尾豐。
性能與美國OpenAI接近
記者:您如何評價DeepSeek的技術?
松尾豐:技術很出色,性能與運營「ChatGPT」的美國OpenAI接近。(DeepSeek)每次發佈新的AI模型,都會發表論文,詳細説明模型採用了什麼樣的技術,以及花費心思實施的改進之處。
該公司還同時以(任何人都可使用的)開源方式進行公開。1月發佈的最新模型「R1」進行了提升推理能力的強化學習。最終展現出了與OpenAI的「o1」同等的推理性能。
記者:在AI開發方面,美國一直處於領先地位。競爭的勢力格局是否會發生變化?
松尾豐:作為大前提,中國的AI水準相當高,可以與美國比肩。至少從頂尖(學會採納的)論文數量來看,中國已經超過美國。
另外,中國還有阿里巴巴、騰訊、百度等其他很多實力強勁的企業,擁有眾多優秀工程師。在這樣的生態系統中,AI不斷得到開發與應用。出現DeepSeek這樣極具實力的企業,並不令人驚訝。
對日本企業來說也是一種鼓舞
記者:您如何看待DeepSeek的出現對日本産生的影響?
松尾豐:日本也需要努力開發生成式AI模型。像DeepSeek這樣並非大型科技企業、也沒有雄厚資本的公司,竟然能夠實現世界最先進的精度,這對日本的初創企業來説也是一種鼓舞。即便在日本國內,只要紮實地進行技術開發,就有可能實現這樣的飛躍。
記者:您如何看待像DeepSeek這樣的企業採取開源戰略的動向?
松尾豐:最初採取開源戰略的企業是美國Meta,該公司推出了「Llama」。後來,中國阿里巴巴推出了性能非常高的模型「Qwen(通義千問)」。在日本,基於這兩家企業的模型進行追加學習的動向也十分活躍。如果基礎模型紮實,就能輕鬆提升性能。
不過,開源強大,還是OpenAI及美國谷歌這樣的非公開系統強大,競爭始終存在。哪一方勝出會因狀況而變。
這次DeepSeek的出現,使得開源方面的勢力得到了很大的恢復。雖然OpenAI及谷歌擁有性能卓越的非公開模型,但這表明開源也能夠做到同樣的事情。
安全風險因使用方式而異
記者:對於利用現有AI模型輸出的數據來創建新的生成AI的DeepSeek的「蒸餾」技術,OpenAI指出這種做法違規。
松尾豐:我不知道情況的真假。在美國企業之間,這樣的傳聞非常常見。這次也可能涉及(中美的)政治含義。
記者:您如何看待使用中的安全等風險?
松尾豐:是利用DeepSeek的開源還是使用其服務?根據使用方式的不同,風險也不同。開源可以下載程式並在本地運作。這樣的話,數據不可能被發送到某個地方。
另一方面,DeepSeek的APP服務在中國的伺服器上運作。一旦輸入數據,這些數據就會發送到中國的伺服器,在中國進行處理並返回。雖然表示不使用這些數據進行學習,但實際上並不排除使用的可能性。
這點不管對於DeepSeek還是OpenAI來説都一樣。這是一個你對對方投以多大信任的問題。
記者:圍繞AI的智慧財産權和資訊洩露問題,中美間的對立似乎還會加劇。
松尾豐:美國(海軍和某些州)提出不要使用DeepSeek。但從研究者的角度來看,我並不認為DeepSeek做了什麼特別的事情。相反,我認為他們只是在好好搞技術並將其發佈。