WPS靈犀=Gemini+Chrome+微軟Office。
文|徐鑫 周路平
編|任曉漁
辦公提效是AI大模型出現(xiàn)后應(yīng)用最廣、也是效果最顯著的場景。在今年5月美國機構(gòu)開展的一次大規(guī)模調(diào)研中,寫作輔助和PPT制作都是排在前列的應(yīng)用。而WPS作為國內(nèi)最老牌的辦公套件,其在AI辦公上的進展一直備受外界關(guān)注。
7月27日,金山辦公發(fā)布了原生Office辦公智能體“WPS靈犀”,用戶只需通過自然語言、多輪對話即可完成文檔創(chuàng)作、演示文稿生成及語音助手等功能,全程無需復(fù)雜操作和外部跳轉(zhuǎn),而且可以在右側(cè)的對話框中,與AI邊聊邊改。
同時,它還能保證PPT生成的效果,順暢完成二次修改編排,貼合現(xiàn)實使用場景的體驗,令不少用戶感到驚喜。“不再是輔助的工具,而是正在變成了一個可控的智能助理。”有人如此形容靈犀的體驗。
基于用戶現(xiàn)實的需求,將AI能力與文檔辦公組件深度融合,靈犀也引領(lǐng)辦公領(lǐng)域走向智能體時代。
01
辦公智能體的“Aha moment”
內(nèi)容創(chuàng)作已經(jīng)是AI最基礎(chǔ)的功能,不管是AI辦公軟件,還是各類通用的AI應(yīng)用都具備創(chuàng)作生成的能力,不過此次WPS靈犀的發(fā)布,卻在強調(diào)“邊聊邊改”,更符合真實辦公場景體驗。
到底實際效果如何,我們也做了上手體驗。
首先演示文稿生成場景。我給靈犀下了一個指示:以深度學(xué)習(xí)技術(shù)的發(fā)展歷程為主題,制作一份演講時長30分鐘左右的演講稿,里面要有行業(yè)內(nèi)的前沿動態(tài)和案例。
AI智能體在接收指令后快速對任務(wù)進行了拆解?梢韵瓤匆幌滤纳疃人伎疾鸾膺^程。
它給出的大綱條理清晰,內(nèi)容豐富,完整地呈現(xiàn)了深度學(xué)習(xí)技術(shù)的發(fā)展階段。而且開頭、結(jié)尾以及段落之間的銜接,有很多口語化的表達,符合演講者的身份,自然鮮活。

既然它說可以邊聊邊改,我也挑了一下它的毛病,要求它優(yōu)化致謝部分的表達方式。
WPS靈犀理解了我的需求,并且精準(zhǔn)定位到了致謝的位置。它還給出了修改的說明,認為可以補充相關(guān)數(shù)據(jù),增加嚴(yán)謹(jǐn)性。
提出了這些修改意見后,在目錄下方有一個挑選PPT模板選項,WPS內(nèi)置了豐富且精美的模版庫。
兩分鐘后,WPS靈犀就生成了數(shù)十頁的PPT,效果令人驚喜。這份PPT不僅風(fēng)格統(tǒng)一、排版精美,而且還插入了各種圖標(biāo)和圖片,甚至這些圖片都是根據(jù)演講內(nèi)容生成,并非是毫無關(guān)聯(lián)的配圖。

生成好了PPT之后,作為一個挑剔的合作者,我再次提出要求。能否跳回大綱部分,補充人機協(xié)同系統(tǒng)構(gòu)建案例。WPS靈犀非常有耐心,它首先回溯了一遍任務(wù),然后上網(wǎng)搜尋了信息,之后再次回到大綱修改了大綱內(nèi)容。
大綱修改完成后點擊就能生成PPT。到具體的PPT頁面里,如果有不滿意需要調(diào)整的地方,側(cè)邊欄的AI智能體又能出馬幫忙。
比如,在某一頁里無論是內(nèi)容、條目數(shù)量還是格式等有問題,都能動態(tài)調(diào)整。

甚至,WPS靈犀還可以根據(jù)生成好的PPT,提供演講腳本的生成,并配上演講者的聲音和動畫,將其制作成演講視頻。

生成的文稿有兩種模式。一種是可以嵌入到演示文稿的備注中,在演講者模式里直接可以成為演講時的提示詞。也可以導(dǎo)出為文檔,直接對著文稿介紹。
除了AI生成演示文稿和PPT,WPS靈犀在合同文書場景里的能力也令人印象深刻。
我最近租房,需要一份租房合同。在使用WPS靈犀之前,我發(fā)現(xiàn)市面上有很多AI助手雖然可以生成合同,但大部分都不能直接生成word,需要自己復(fù)制粘貼到word。體驗割裂不說,合同本身需要有排版格式,復(fù)制到word里格式往往一團糟,很難上手即用。
而WPS靈犀直接給了我一份帶格式的合同,調(diào)格式的煩惱直接沒有了。
這波體驗下來最直觀的感受是,用起來更有確定性和更可控。其亮點如下:第一,它用聊天對話的方式就把內(nèi)容定了。第二,它不追求一錘子端到端搞一個看起來酷炫的東西,而是務(wù)實地認為,辦公場景需要通過多輪自然語言對話,逐步讓AI給用戶交付一個更符合用戶需求的東西。第三,它也不只是生成內(nèi)容,還能交付有確定性的格式和呈現(xiàn)效果。
“現(xiàn)實生活中我們就是這么工作的。當(dāng)你有一個真正的助理,最高效的溝通方式一定是你一邊對著文檔,一邊告訴他你需要什么。”WPS助理總裁田然在WAIC演講中說。
02
“邊聊邊改”,技術(shù)實現(xiàn)起來并不容易
相比外界的一句話生成文本或者演示文稿,WPS靈犀的新穎之處是邊聊邊改,實時同步結(jié)果。這個差異能看到WPS在產(chǎn)品理念層面,選擇向貼近用戶使用場景,更務(wù)實的方向演進。
“一句話生成一個完整內(nèi)容,這件事并不符合日常用戶的交互和使用習(xí)慣。人的創(chuàng)作過程,本質(zhì)也是一個非線性的逐步成形,螺旋逼近成品的過程。”WPS AI PPT產(chǎn)品負責(zé)人陸煒俊說。
而除了產(chǎn)品理念貼合用戶需求之外,數(shù)智前線與WPS產(chǎn)品技術(shù)團隊的交流同時得知,頗刷大眾好感的“邊聊邊改”實現(xiàn)起來并不如看起來那么容易。

資深人士介紹,市面上此前一鍵生成PPT的模式,本質(zhì)上是把非結(jié)構(gòu)的內(nèi)容變成結(jié)構(gòu)化的大綱,后面的動作就是套模版。
而WPS靈犀通過與用戶的多輪對話來理解用戶,在大綱環(huán)節(jié)確保符合用戶需求。同時,這個環(huán)節(jié)相比其他一鍵生成模式,技術(shù)突變點在于讓大腦能夠行動的腳手架上,有了腳手架讓大綱可以做增刪改查。
這里面,大模型推理能力的升級非常關(guān)鍵;D芰θ绻粡,沒有那么強的指令遵從能力,泛化時可能就會出現(xiàn)幻覺,模型就容易亂編格式,編完再渲染回文檔或者演示文件,效果會很糟糕。
而隨著智能中樞大腦的推理能力變強,給能理解更復(fù)雜語義的大腦中樞提供一個可以增刪改查的手腳,生成大綱這一步就多了一個控制節(jié)點。WPS產(chǎn)品團隊認為,大綱編輯器是他們給行業(yè)提供的一個基建。
“它看起來像一個文檔,但它不是文檔,也不完全是markdown,而是我們?nèi)藶槎x的正文節(jié)點的一個編輯器。我們讓大模型認識了這個大綱編輯器,圍繞著大綱的這個增刪改查的腳手架才能調(diào)動成功。”陸煒俊說。
在體驗中,我們也發(fā)現(xiàn),圍繞著大綱內(nèi)容的調(diào)整,WPS靈犀已經(jīng)有非常精準(zhǔn)的定位能力。比如我想要它調(diào)整致謝相關(guān)表達時,大模型能理解整個大綱里哪個部分是致謝,其他部分的大綱就不發(fā)生變化。
而整個PPT制作過程有三層,在內(nèi)容之外,還有排版和樣式。目前排版樣式需要在生成的PPT文件內(nèi)調(diào)整。這些調(diào)整過程目前也用到了AI能力,比如三個信息點增加成四點,點擊一個按鈕版式上會自動變成能容納四層信息的樣式,用戶無需自己排版對齊美化。
但當(dāng)下它還不是在靈犀里用聊的方式完成的。“現(xiàn)在還沒法在全篇文檔里來改細節(jié)格式,圍繞著格式版式有1萬個API,排列組合下來它是一個天文數(shù)字。”
WPS產(chǎn)品團隊介紹,這是他們接下來努力的方向。要往這方向發(fā)展,有不小的難度。
這里面不止是要把組件的各種格式能力打碎,能被原子化地調(diào)度。更重要的是要讓AI調(diào)用API的時候既能發(fā)揮AI的創(chuàng)造性,又能嚴(yán)謹(jǐn)遵循格式要求。田然認為,組件有那么多的API,尤其是表格,復(fù)雜度極其高,以什么樣子的方式又得讓AI能用到,同時又不會把AI去用廢了。兩邊的都需要大量的工程工作。
據(jù)了解,目前WPS產(chǎn)品團隊已經(jīng)構(gòu)建了一套新的更適合AI原生的API,它作為一種中間協(xié)議,在模型和編輯器中雙向溝通,發(fā)揮模型的創(chuàng)造性,同時也確保產(chǎn)出結(jié)果在格式等層面的可控性。
不過WPS認為,他們來做這件事也有固有的優(yōu)勢。與市面上的其他產(chǎn)品相比,WPS擁有海量的用戶,也圍繞著Office做了幾十年的技術(shù)積累。今年年初,金山辦公披露,WPS Office PC版的日活設(shè)備數(shù)已經(jīng)過億。這不僅能讓他們更熟悉用戶的需求,也能從產(chǎn)品層面更好地滿足需求。
“能夠用好AI,還能夠理解office,這就是我們跟別人不一樣的地方。office有1萬個API,我們接下來怎么把這1萬個API能夠封裝為讓AI能調(diào)度,這是我們幸福的煩惱。”陸煒俊說。
03
從與微軟掰手腕到引領(lǐng)半個身位
WPS最早誕生于1988年,比微軟Office先開啟中文文字處理時代。雙方多年來一直在交鋒。不過,微軟Office早年憑借兼用協(xié)議和系統(tǒng)捆綁銷售的方式搶占了絕大部分市場,也因此通過Office辦公三件套定義了文檔的格式、成為了行業(yè)標(biāo)準(zhǔn)。
而這些年,WPS通過布局移動端,持續(xù)在兼容性和生態(tài)上下功夫,也逐漸奪回了本土市場。2025年一季報的數(shù)據(jù)顯示,WPS Office全球月活設(shè)備數(shù)達到6.47億。
進入AI時代,新的競爭格局仍在持續(xù)變化。在WPS AI 1.0時代,外界依稀還能看到微軟的影子。但隨著WPS AI 3.0的原生Office智能體靈犀的發(fā)布,金山辦公在PPT生成和文檔生成等方面的體驗已經(jīng)走在了前列,成為AI辦公領(lǐng)域的先鋒者。
在金山辦公助理總裁田然看來,微軟Copilot的產(chǎn)品形態(tài),屬于是WPS AI 3.0之前的版本。
一位金山辦公內(nèi)部人士告訴數(shù)智前線,金山辦公WPS與微軟Office在AI上做的事情有相似之處,都是給用戶提供更加智能化的操作,但兩者的整體技術(shù)路線其實不完全相同,微軟現(xiàn)有的產(chǎn)品更偏向基于現(xiàn)有功能,然后加上AI能力。
而金山辦公會從更加底層,把程序最底層的API暴露給模型,然后模型用代碼的方式去生成,這更能保證AI生成的準(zhǔn)確性和覆蓋度,“但這樣的技術(shù)難度曲線就會比較陡峭”。
在田然看來,WPS靈犀做的事情和Cursor的邏輯非常相似,“只不過Cursor是給程序員做,我們是給所有的文檔工作者做。”
程序員寫代碼需要在IDE的環(huán)境中實現(xiàn),而Cursor做的最核心的事情是把大模型的能力與vscode編輯器的能力做了深度融合。這種能在真正的編譯運行環(huán)境實際使用的代碼與早期AI生成的代碼是兩回事。
WPS靈犀則是在Word或者PPT的編輯器里面來實現(xiàn)交互過程,嘗試推動AI和辦公軟件的深度融合,“不是把軟件的10000個API教給AI,而是針對場景做AI和軟件的雙向改造,軟件為AI設(shè)計專有能力,同時教會AI跟軟件深度交流,最終依靠用戶、軟件、AI之間多輪交流,輸出真正可用的內(nèi)容。”
田然將WPS靈犀形容為融合了Gemini、Chrome和微軟的能力,做到了把用戶真正想要的文檔形式跟AI之間的交互,“這個市場上今天僅此一家”。
除了技術(shù)路線上的不同,WPS之所以能在AI體驗上做出驚喜,也跟金山辦公一直以用戶需求為中心的務(wù)實心態(tài)有很大關(guān)系。
金山辦公反復(fù)強調(diào)的一點是,不會去發(fā)布看起來酷炫但落不了地的功能,而是基于海量用戶的反饋去解決已經(jīng)存在的痛點和需求。相反,市面上很多企業(yè)做產(chǎn)品的思路是先做一個酷炫的Demo,推向市場,進而拿到融資。
這種務(wù)實也體現(xiàn)在金山辦公對自身的定位上。金山辦公從一開始就明確不做基礎(chǔ)大模型,而是基于業(yè)內(nèi)最優(yōu)秀的大模型,集中精力放在AI的應(yīng)用落地。
今年初,金山辦公首次發(fā)布了五年戰(zhàn)略,金山辦公決定將適當(dāng)放寬對WPS Office的收入增長目標(biāo),轉(zhuǎn)而把用戶體驗置于更優(yōu)先的位置,同時將“WPS AI做成辦公領(lǐng)域的AI引領(lǐng)者”。而WPS靈犀也在剛剛結(jié)束的2025世界人工智能大會'>人工智能大會上,獲評為“鎮(zhèn)館之寶”。
回顧金山辦公的37年發(fā)展歷程,它仿佛一場穿越重重困難的長征。但愿意花笨功夫,愿意根據(jù)用戶真實需求去踏踏實實做產(chǎn)品的金山辦公最終生存下來,且一步步走向壯大。WPS這一次推出原生Office智能體靈犀,是WPS在AI的大時代,成為AI辦公先鋒者的關(guān)鍵。