生成式人工智能：發展演進及產業機遇- #中國管理咨詢網（ #chnmc.com )

<u id="miyiy"></u>

<tr id="miyiy"><label id="miyiy"></label></tr>

創新與領導力

生成式人工智能：發展演進及產業機遇

當OpenAI 在 2022 年 11 月 30 日發布 ChatGPT 的時候，沒有人會意識到，新一代人工智能浪潮將在接下來的 6 個月給人類社會帶來一場眩暈式的變革。自2010年代初深度學習問世以來，人工智能進入到第三次高潮。而2017年Trans

作者：徐思彥來自：騰訊研究院點擊：次日期：2023-08-25

當OpenAI 在 2022 年 11 月 30 日發布 ChatGPT 的時候，沒有人會意識到，新一代人工智能浪潮將在接下來的 6 個月給人類社會帶來一場眩暈式的變革。自2010年代初深度學習問世以來，人工智能進入到第三次高潮。而2017年Transformer算法將深度學習推向了大模型時代。OpenAI基于Transformer的Decoder部分建立起來了GPT家族。

ChatGPT一經面世便風靡全球，人們驚訝于其能夠進行連貫、有深度對話的同時，也驚異地發現了它涌現了推理、思維鏈等體現智能的能力。伴隨AI預訓練大模型持續發展、人工智能生成內容（AIGC）算法不斷創新以及多模態AI日益主流化，以ChatGPT為代表的AIGC技術加速成為AI領域的最新發展方向，推動AI迎來下一個大發展、大繁榮的時代，將對經濟社會發展產生重大的影響。

AIGC 技術的定義及背景

AIGC（Artificial Inteligence Generated Content），指的是通過人工智能技術自動生成內容的生產方式。通過訓練模型來生成新的、與訓練數據相似的內容。與傳統類型的AI主要關注識別和預測現有數據的模式不同，AIGC著重于創造新的、有創意的數據，其關鍵原理在于學習和理解數據的分布，進而生成具有相似特征的新數據，在圖像、文本、音頻、視頻等多種領域都有廣泛的應用。AIGC目前最引人注目的應用當屬ChatGPT。ChatGPT是基于OpenAI公司的大型語言模型GPT-3.5訓練、調試、優化的聊天機器人應用，同一個AI模型可以處理各種各樣的文字和推理任務。ChatGPT發布僅兩個月即獲得1億月活用戶，超越了歷史上所有互聯網+消費者應用軟件的用戶增長速度。以大型語言模型、圖像生成模型為代表的AIGC技術，成為新一代人工智能的平臺型技術，助力不同行業實現價值躍升。

AIGC大爆發的背后，普遍認為三個領域的AI技術的發展為其提供了肥沃的土壤，分別是生成算法、預訓練模型和多模態技術。

第一，隨著各種生成算法的不斷創新突破，AI現在已經可以生成文字、代碼、圖像、語音、視頻物體等各種類型的內容和數據。AIGC與過去最顯著的區別是從分析式AI（Analytical AI）發展為生成式AI（Generative AI）。分析式AI模型是根據已有數據進行分析、判斷、預測，最典型的應用之一是內容智能推薦；生成式AI模型則是學習已有數據后進行演繹、生成創造全新內容。

第二，預訓練模型，也就是我們常說的大模型，引發了AIGC技術能力的質變。在過去，研究人員需要針對每一個類型的任務單獨訓練AI模型，訓練好的模型只能從事特定任務，不具有通用性。而預訓練的大模型技術顯著提升了AIGC模型的通用化能力和工業化水平，讓AIGC模型成為自動化內容生產的“工廠”和“流水線”。生成式AI模型，包括ChatGPT、GPT-4等大語言模型（Large Language Models，LLM）和Midjourney、Stable Diffusion等圖像生成模型，又被稱為基礎模型（Foundation Models），其作為基于種類豐富的海量數據預訓練的深度學習算法，展現出強大的、更加泛化的語言理解和內容生成能力。

以大型語言模型（LLM）為例，經過海量的互聯網+內容數據的訓練，語言模型的參數可以達到萬億甚至百萬億級別。這大大增強了語言模型的生成能力，同一個語言模型可以高質量地完成各種各樣的文字和推理任務，例如作詩、寫文章、講故事、寫代碼、提供專業知識等等。因此，大模型已經成為了各大企業競相追逐的AI方向。

第三，多模態AI技術的發展。多模態技術讓AIGC模型可以跨模態地去生成各種類型的內容，比如把文字轉化為圖片、視頻等等。進一步增強了AIGC模型的通用能力。[1]

以下是AIGC領域的一些基本技術：

1）生成對抗網絡（GAN, Generative Adversarial Networks）：GAN是由Ian Goodfellow等人于2014年提出的一種生成式模型。它由生成器（Generator）和判別器（Discriminator）兩部分組成。生成器負責生成新的數據，判別器負責判斷生成數據與真實數據的相似程度。通過不斷的訓練，生成器能夠生成越來越逼真的數據。
2）變分自編碼器（VAE, Variational Autoencoders）：VAE是一種基于概率生成模型的生成式方法，它通過編碼器（Encoder）和解碼器（Decoder）兩部分來實現數據的生成。編碼器負責將輸入數據映射到潛在空間中的一個分布，解碼器負責從潛在空間中的分布采樣數據并生成新的數據。
3）循環神經網絡（RNN, Recurrent Neural Networks）：RNN是一種用于處理序列數據的神經網絡結構。RNN具有記憶功能，能夠捕捉序列數據中的時序信息。在生成式人工智能中，RNN可以用于生成文本、音樂等序列數據。
4）Transformer模型：Transformer是一種基于自注意力（Self-Attention）機制的神經網絡結構，它在自然語言處理領域取得了顯著的成果。Transformer模型可以用于生成式任務，如文本生成、機器翻譯等。

其他相關技術：除了上述技術外，還有一些其他的生成式模型和技術，如PixelRNN、PixelCNN、WaveNet等。這些技術在圖像和音頻生成等領域也取得了一定的成果。

大語言模型等生成式AI技術帶來了新的AI發展范式，其應用前景十分廣闊。。對于大眾而言，生成式AI意味著新的創造力工具，將在更大程度上解放個體的創造力和創意生產。除此之外，AIGC還將改變獲取信息的主要方式。ChatGPT在尋找答案、解決問題的效率上已經部分的超越了如今的搜索引擎，ChatGPT或許在未來會改變我們獲取信息、輸出內容的方式，AIGC有望成為數字經濟時代驅動需求爆發的殺手級應用。

比爾·蓋茨將人工智能的發展和微處理器、個人電腦、互聯網以及智能手機相提并論，認為其將重塑所有的行業。微軟公司首席執行官Satya Nadella認為，ChatGPT是知識工作者的“工業革命”，斷言人工智能將徹底改變所有類型的軟件服務。目前，搜索、辦公、在線會議等諸多軟件服務都已融入了生成式AI的能力。OpenAI公司首席執行官Sam Altman稱，多模態的AI大模型有望成為繼移動互聯網之后的新的技術平臺。這意味著，開發人員基于預訓練的AI大模型，可以通過模型微調快速開發出垂直領域的模型應用并予以部署使用，人工智能的革命性正在于此。[2]

AIGC的應用領域及案例

1.文本生成領域

自然語言生成是一種AIGC 技術，可以生成逼真的自然語言文本。生成式AI可以編寫文章、故事、詩歌等，為作家和內容創作者提供新的創作方式。同時，它還可以用于智能對話系統，提高用戶與AI的交流體驗。

ChatGPT (全名:Chat Generative Pre-trained Transformer對話生成式預訓練變換模型 )是由 OpenAI 開發的一個人工智能聊天機器人程序，于2022年11月推出。該程序使用基于 GPT-3.5 架構的大型語言模型并通過強化學習進行訓練。 ChatGPT 目前仍以文字方式互動，可以解決包括自動文本生成、自動問答、自動摘要等在內的多種任務。

Jasper已經開始為谷歌、臉書等知名公司提供文案AIGC的商業服務。

2.圖像生成領域

圖像生成是AIGC 技術中最為普遍的應用之一。Stability AI發布了穩定擴散（Stable Diffusion）模型，通過開源快速迭代大幅降低了AI繪畫的技術使用門檻，消費者可以通過訂閱旗下產品DreamStudio來輸入文本提示詞生成繪畫作品，產品已經吸引全球50多個國家超過100萬的用戶注冊。

3.音視頻創作與生成

AIGC 技術可以用于語音合成，即生成逼真的語音。例如，通過學習人類的語音特征，生成式模型可以生成逼真的語音，從而用于虛擬助手、語音翻譯等應用。AIGC 技術可以用于生成音樂。生成式AI可以根據給定的風格和旋律創作新的音樂作品，為音樂家提供新的創作靈感。這種技術還可以幫助音樂家更有效地探索音樂風格和元素的組合。這些曲目可以用于音樂創作、廣告音樂等應用。

4.電影與游戲

生成式AI可以用于生成虛擬角色、場景和動畫，為電影和游戲制作帶來更多的創意可能。此外，AI還可以根據用戶的喜好和行為生成個性化的故事情節和游戲體驗。

2023年3月，騰訊AI Lab在GDC上提出了3D虛擬場景自動生成解決方案，能夠幫助游戲開發者以更低成本創造風格多樣、貼近現實的虛擬城市，提升3D虛擬場景的生產效率。其中重點分享了城市布局生成、建筑外觀生成和室內映射生成三大能力。整個路網生成和微調過程僅需要不到30分鐘，相比手動設計效率提升近100倍；而單個獨特建筑的制作時間也降低至17.5分鐘，大大提升了場景制作的效率。

5.科研與創新

生成式AI可以在化學、生物學、物理學等領域探索新的理論和實驗方法，幫助科學家發現新的知識。此外，生成式AI還可以用于藥物設計、材料科學等領域，加速技術創新和發展。

6.代碼生成領域

經過自然語言和數十億行代碼的訓練。部分生成式AI模型精通十幾種語言，包括Python、JavaScript、Go、Perl、PHP、Ruby等等。能夠根據自然語言的指令生成相應的代碼。

GitHub Copilot是一個GitHub和OpenAI合作產生的AI代碼生成工具，可根據命名或者正在編輯的代碼上下文為開發者提供代碼建議。官方介紹其已經接受了來自 GitHub 上公開可用存儲庫的數十億行代碼的訓練，支持大多數編程語言。

騰訊云新一代AI 代碼助手 CODING Wise：將大模型 AI 能力賦能給開發者，增強開發體驗，提升開發效率。CODING Wise 支持多種編程語言、主流開發框架和常用IDE。具備代碼補全、生成單元測試、代碼糾錯等能力，能輔助開發者加速開發過程，提升開發質量。CODING Wise 能力覆蓋溝通、編碼、評審等關鍵環節，包括：溝通環節：通過對話方式，進行上下文推理給出代碼回復，幫助開發者理解代碼邏輯；研發環節：根據當前代碼類型、代碼上下文等信息進行代碼補全；能根據代碼反向生成注釋和單元測試代碼；排錯環節：進行代碼查錯、定位問題并輔助生成建議；隨后給出建議代碼、替換錯誤的代碼塊；評審環節：輔助開發者生成代碼提交信息，也可以輔助評審者生成評審建議；調試環節：可通過自然語言指令實現快速的代碼修改和調優。

7.內容理解與分析

騰訊會議·AI小助手：只需通過簡單自然的會議指令，基于對會議內容的理解，就可以完成信息提取、內容分析、會管會控等多種復雜任務。會后可以自動生成智能總結摘要，還能基于智能錄制的能力，幫助用戶高效回顧，提升用戶開會和信息流轉效率。

彭博社于近期發布了為金融界打造的大語言模型（LLM)——BloombergGPT。它使用了類似于ChatGPT的技術原理，即使用Transformer模型和大規模預訓練技術來實現自然語言處理，擁有500億參數。BloombergGPT的預訓練數據集主要來自彭博社的新聞和金融數據，構建了一個3630億個標簽的數據集，支持金融行業的各種任務。

BloombergGPT的目標是幫助用戶更好地理解和分析金融數據和新聞。它可以根據用戶的輸入，生成與金融相關的自然語言文本，例如新聞摘要、市場分析、投資建議等。它的應用場景主要包括金融分析、投資咨詢、資產管理等領域。例如，在資產管理領域，它可以根據歷史數據和市場情況，預測未來的股票價格和交易量，為投資經理提供投資建議和決策支持。在財經新聞領域，BloombergGPT可以根據市場數據和事件，自動生成新聞摘要和分析報告，為讀者提供及時、準確的金融信息。

8.AI智能體（AI Agent）

AI智能體（AI Agent）被認為是OpenAI的下一個方向。從今年 3 月 AutoGPT 推出后，Generative Agent、GPT-Engineer、BabyAGI 項目的爆發將 LLM 的敘事代入了新的階段，從“超級大腦”到真正有可能成為“全能助手”。

2023年4月，一個名叫AutoGPT的開源項目在Github上發布了，截止至2023年4月16日，該項目已經獲得70K+星。AutoGPT是一個由GPT-4驅動的可以自主實現用戶設定的任何目標的開源應用程序。當用戶提出一個需求或任務時，AutoGPT會自主分析問題，給出具體的執行計劃并開始執行，直到完成用戶提出的要求。

Auto-GPT的出現意味著AGI正逐漸向更加自主化和智能化的方向發展。首先，它可以使人工智能應用更加普及和便利?，FAuto-GPT能夠自主分析和執行任務，大大降低了應用的門檻和成本，讓更多的人能夠輕松地使用人工智能技術來解決問題。其次，Auto-GPT能夠提高人工智能應用的效率和精度。傳統的人工智能模型需要從頭到尾地執行整個任務，這會浪費很多時間和計算資源，并且容易出現錯誤。AutoGPT可以自主分析任務，并且提出具體的執行計劃，這樣可以大大縮短執行時間，并且減少錯誤率。[3]

盡管Auto-GPT還在非常早期的實驗階段，但其開創了一種全新的AI交互方式，即由機器主動提出任務和計劃，人類只需要給出任務目標。這種交互方式不僅提高了AI智能體的自主性和靈活性，同時也拓展了人與AI之間的交互方式，打破了人類對于人工智能的“控制”想象，使得人工智能技術能從“工具”走向人類的“伙伴”。

除了獨立的AI Agent之外，未來還可能出現由多個AI智能體組成的“虛擬智能社會”。GenerativeAgents—在由斯坦福大學和谷歌聯合發表的一篇名叫《GenerativeAgents:InterativeSimulacra of Human Behavior》論文中，研究者們成功地構建了一個“虛擬小鎮”，其中的25個智能體在小鎮上生存。借助AIGC，其中的NPC具備了可信人類行為，并對周圍環境變化做出適當的反應，使得可以用現實社會現象去填充賽博空間。

國外商業咨詢機構預測，到2030年AIGC和生成式AI市場規模將達到1100億美元。正如“互聯網+”一樣，“AIGC+”有望滲透到各行各業，在教育、醫療、金融、政務、制造、機器人、數字人、元宇宙、廣告營銷、電子商務、市場和戰略咨詢等眾多領域帶來新的應用形式，深度賦能千行百業，助力高質量發展。

AIGC的產業應用中的挑戰與問題

1.可解釋性與可靠性

生成式人工智能的可解釋性問題是指生成式人工智能（Generative Artificial Intelligence）所產生的結果難以解釋或理解。生成式人工智能是一種基于深度學習的人工智能技術，其通過學習大量數據來生成新的數據或圖像。但是，生成式人工智能所產生的結果通常很難理解和解釋，因為其內部的運作過程非常復雜，而且很難直觀地描述。

這種可解釋性問題對于許多應用場景都非常重要，比如醫療診斷、金融風控、自動駕駛等領域。在這些領域中，人們需要了解生成式人工智能的內部運作過程，以便更好地理解其產生的結果，并且能夠對其進行調整和優化。

解決生成式人工智能的可解釋性問題是當前人工智能研究的一個重要方向，研究人員正在探索各種方法來使生成式人工智能的結果更加可解釋和可理解。這些方法包括可視化技術、可解釋性模型、對抗性樣本等等。

2.AI大模型的價值對齊問題

所謂人工智能的價值對齊（AI Alignment），就是讓人工智能系統的行為符合人類的目標、偏好或倫理原則。價值對齊是AI安全研究的一個核心議題。在理論上，如果一個強大的AI系統所追求的目標和人類的真實目的意圖和價值不一致，就有可能給人類帶來災難性后果。就目前而言，大語言模型的價值對齊問題主要表現為，如何在模型層面讓人工智能理解人類的價值和倫理原則，盡可能地防止模型的有害輸出，從而打造出更加有用同時更加符合人類價值觀的AI模型。在這方面，RLHF是一個有效的方法，通過小量的數據就可能實現比較好的效果。簡言之，RLHF要求人類專家對模型輸出內容的適當性進行評估，并基于人類提供的反饋對模型進行優化。其目標是減少模型在未來生產有害內容的可能性。實際上，RLHF算法不僅是確保AI模型具有正確價值觀的關鍵所在，而且對于生成式AI領域的長期健康可持續發展也十分重要。[4]

3.塑造負責任的AI創新生態

大語言模型等生成式AI的進展，在讓人們看到AGI曙光的同時，也帶來更加復雜難控的風險，包括對人類未來生存的潛在風險。AI時代需要成為一個負責任創新的時代，而非另一個“快速行動、打破陳規”的時代。人們需要建立合理審慎的AI倫理和治理框架，塑造負責任的AI生態，打造人機和諧共生的未來。生成式AI領域的創新主體則需要積極探索技術上和管理上的安全保障措施，為生成式AI的健康發展和安全可控應用構筑起防護欄。

在科技向善理念之下，人工智能時代不應成為另一個“快速行動、打破陳規”的時代（即先快速把產品做出來，事后再通過修補、補救等方式解決其社會問題），而應成為一個負責任創新的時代，通過建立合理審慎的AI倫理和治理框架，塑造負責任的AI生態，打造人機和諧共生的未來。[5]

AIGC在產業應用中的未來趨勢

1.多模態帶來創新應用藍海

多模態AI是指能夠處理和理解多種類型信息的人工智能，如文本、圖像、音頻、視頻等。這種AI不僅能夠處理單一數據類型的任務，而且可以在不同數據類型間建立聯系和融合，從而實現一個綜合、全面的理解多模態。AI能夠對各種不同類型的數據進行關聯分析，為解決復雜問題提供支持。

在多模態技術發展初期，不同模態的AI開始進行集成，比如圖像識別和自然語言處理技術的結合。除了ImageBind打通六種模態外，多數仍在探索文本與圖像的融合，但進展飛快。UniDiffuser:除了單向文生圖，還能實現圖生問、圖文聯合生產、無條件圖文生成等多種功能

OpenAI開發了許多多模態AI案例如 DALL-E、CLIP 等，可以識別圖像中的對象，同時生成與圖像相關的描述性文本，或由文本指導生成有關物品的新圖像。

隨著多模態技術的進展，多模態AI在理解和處理不同類型數據時能夠實現更高程度的融合。算法和模型可以在不同數據類型之間建立聯系，提取跨模態的共享信息。這使得AI能夠深度理解和解決復雜問題。未來在諸多創新領域，多模態技術的發展將帶來創新應用的藍海。[6]

2.生成式AI帶來更貼近人的交互方式

從使用鍵盤-鼠標等方式跟電腦交互，到使用手指滑動屏幕跟手機交互，再到人們用喚醒詞跟智能音箱等交互，人機交互從識別機器指令，到識別人的動作，語音，不斷朝著更貼近人的習慣的交互方式演進。生成式AI的發展，讓人類有史以來第一次有機會用自然語言的方式，來跟機器對話，而機器也借由大模型擁有了極強的理解人類語言的能力，有望帶來一場全新的交互變革。正如歷次交互變革帶來從終端、到連接，到各類應用的顛覆式變革，生成式AI也必將帶來產業鏈、價值鏈和生態的重塑。

生成式AI的技術突破，帶來了大模型理解能力的大幅提升。大模型可以更好地理解人類表達的含義，并生成更符合人類價值觀的回答。其技術成熟度已經可以在很多場景下達到可用，甚至好用的程度。在科技公司不斷投入對齊工作的進展中，大模型的“幻覺”被持續降低，從而讓人類第一次有可能完全以自然語言對話的方式來跟機器交流。這也是人去發掘機器智能最簡單直接，最有效的交互方式。

在這個背景下，所有APP都可以用生成式AI重做一遍，并可能產生原生AI APP。一方面，當前的所有軟件，在后端不變的情況下，前端的交互可以直接換成自然語言對話的方式，這樣讓更多的APP擁有了智能對話的能力，給用戶帶來全新的體驗?，F在已經有很多應用軟件和硬件，開始往這個方向升級。另一方面，未來更具市場想象力的，是原生的AI APP，例如未來很可能出現一個萬能的個人助理，他可以回答人的各種問題，幫人出主意，甚至做會議預定、文章撰寫、藝術創作等更多的工作?！皺C器生成+人腦篩選”在可預見的將來，會成為人機協作的重要方式。[7]

結論

綜上所述，生成式人工智能在發展演進過程中取得了顯著的成果，為人類社會的進步和發展提供了強大的技術支持。從深度學習、自然語言處理等技術的發展，再到生成式人工智能在各個產業中的應用，都展示了其強大的潛力和價值。然而，伴隨著技術的不斷創新和突破，生成式人工智能在應用過程中也暴露出了一些問題，如數據安全、隱私保護、倫理等方面的挑戰。因此，未來的研究應關注如何在保障技術創新的同時，解決這些潛在問題，以實現生成式人工智能的可持續發展。此外，各國政府、企業、研究機構等應加強合作，共同推動生成式人工智能的研究與應用，以實現人類社會的共同繁榮與進步。圖片

本文首發于《人工智能》2023年第四期

參考資料:

[1]騰訊研究院.AIGC發展趨勢報告2023[R].2023

[2]陳楚儀、曹建峰. AIGC技術的發展趨勢、影響和展望[J].2023.中國銀行業

[3]宋嘉吉等. Auto-GPT評測——更聰明的AGI[R].2023

[4]曹建峰.邁向可信AI：ChatGPT類生成式人工智能的治理挑戰及應對[J].2023.上政學報

[5][6][7]騰訊研究院.大模型時代的AI十大趨勢2023[R].2023

生成式人工智能

所屬專題：

|行業最新研究報告（下載）|最新熱點報告（下載）|

立即QQ咨詢　　　 在線提交咨詢問題

WORK WITH US

預約咨詢服務

有管理問題，中國找管理咨詢平臺！

提供企業戰略規劃、人力資源、信息規劃、行業研究、商業計劃、企業助手一站式服務！.

現在就預約咨詢服務

填寫一下，我們幫您解決問題

可以QQ聯系： 896161733；也可以電話： 18121118831

商務服務

微信或者電話聯系：18121118831

商業計劃書

商務文檔撰寫

提供商業計劃書、投資計劃書咨詢、撰寫和指導

點擊查看詳細

可行性研究報告

商務咨詢業務

服務企業、政府和投資者，提供各個產業可行性研究報告撰寫和咨詢服務

點擊查看詳細

物流產業園區規劃

商務咨詢業務

為企業提供物流園區規劃咨詢，包括市場調研、可行性、總體戰略和運營規劃等等

點擊查看詳細

PPT設計制作

商務PPT制作

商業計劃書是一份全方位的項目計劃，它從企業內部的人員、制度、管理以及企業的產品、營銷、市場等各個方面對即將展開的商業項目進行可行性分析（包含論文PPT）。

點擊查看詳細

中國管理咨詢網服務客戶

真誠合作

无码有码日韩人妻无码专区,日韩毛片无码国产,中文字幕亚洲情日韩,日韩福利黄网高清