第463章超級對齊

 

但有道理，也可以去實踐。

就像老師與學生的關係。

老師的能力並不一定比學生強，但是老師可以監督、指導、引導學生。

“我們希望通過弱模型來監督強模型，讓強模型對人類始終抱有溫和、溫暖而積極的情感。”蘇茨克維說。

常樂看向小馬哥。

小馬哥覺得可以。

“弱模型的能力可以不比強模型強，但是可以理解並監督強模型的行為，引導它在規則和範式內運行。”小馬哥是這麼理解的：

“必要時可以及時向人類發出預警，便於做出針對的有效舉措。”

“譬如，強模型按照它的理解編寫數百萬行、且具有危險性的代碼，而人類並不能理解這些代碼。”

“但是弱模型可以，因為它們系出同源，即便它無法干預。”

“從理論上講，這種方式確實可行。”徐總說。

“可以一試，不用畏畏縮縮，只有進行下去才能知道成效。”任總也說。

“可以，我沒有意見。”李飛跟著說。

很快，大家都取得共識，決定按照蘇茨克維的思路去著手、部署。

新部門沿用蘇茨克維的建議，取名“超級對齊”。

“超級對齊”隸屬於Ai項目組，但又相對獨立，對項目進展有干涉權。

但沒有決定權，可以直接向研究院甚至向樂達投資報告。

李飛的項目組繼續推進weChatgpt的學習和訓練，逐步趨向於完善。

但是，在重大事項上，需要與“超級對齊”部門協商，彼此配合，同步進退。

算力上，提供30%的算力來支持“超級對齊”部門。

一定程度會影響weChatgpt的迭代進程。

但是想到它那驚人的迭代速度，即便不是算力全負荷運轉，想來也不會慢太多。

至於人員。

從李飛項目組抽一批。

“鵝廠可以選一批人過來。”小馬哥很積極。

因為，weChatgpt項目，鵝廠有股份，將來商用，鵝廠可以分成。

“我們也可以支援一批人過來。”任總表態。

第463章 超級對齊