久久青青草原一区二区,99精品国产高清一区二区麻豆

大模型密集發布期，高質量的數據資源才是推動GPT進化的重要高手。

4月10日，商湯發布日日新大模型，及其衍生產品：商量（自然語言）、秒畫（文生圖）、如影（數字人）、空間3D大模型（瓊宇、格物），大模型涵蓋文本和圖像生成，計劃23年開啟萬億參數大規模大模型訓練，也是多模態大模型。

【資料圖】

此外，在日日新大模型平臺下，還有一個"商量"語言發模型sensechat，可以用在法律、編程以及醫學診斷的專業場景之下。以編程為例，生成代碼的一次通過率達到40.2%，已經超過了Github Copilot。

華爾街見聞·見智研究認為：對于大模型訓練來說，能否未來得到優質的大模型，與投入的數據質量非常關鍵，包括通用參數、文本語言、圖像、視頻音頻等等，投入數據的質量高低，會直接影響模型最終生成的內容。

日日新大模型的亮點包括：

NLP大模型【商量】：擁有1800億參數，類比ChatGPT。支持長文本理解（支持上傳PDF，并可與PDF對話）、輔助編程、手寫OCR等功能，并現場演示在線問診等應用。
文生圖大模型【秒畫】：模型擁有超過10億參數，類比midjourney?？奢o助提供提示詞，并生成符合描述的圖片，支持6k高清圖像，并可隨時調整畫風。
數字人大模型【如影】：可根據5min視頻創作屬于自己的數字人，并進行AI換裝、文案生成，可用于直播、視頻生成等場景。
空間3D大模型【瓊宇、格物】：瓊宇使得3D場景實時可交互/編輯，應用涉及數字孿生、建筑設計、影視創作、文旅和電商等。格物使得人/物/場便捷編輯創作，可用于家裝、商業廣告、文旅等場景。

評判大模型是否是一個好的大模型，最關鍵的還是源于投入模型的數據質量，只有高質量的數據才能夠讓大模型訓練出高質量的內容。（大模型的計算量=參數量*處理的數據量）