取個名很難啊 作品

第463章 超級對齊

 但有道理,也可以去實踐。 

 就像老師與學生的關係。 

 老師的能力並不一定比學生強,但是老師可以監督、指導、引導學生。 

 “我們希望通過弱模型來監督強模型,讓強模型對人類始終抱有溫和、溫暖而積極的情感。”蘇茨克維說。 

 常樂看向小馬哥。 

 小馬哥覺得可以。 

 “弱模型的能力可以不比強模型強,但是可以理解並監督強模型的行為,引導它在規則和範式內運行。”小馬哥是這麼理解的: 

 “必要時可以及時向人類發出預警,便於做出針對的有效舉措。” 

 “譬如,強模型按照它的理解編寫數百萬行、且具有危險性的代碼,而人類並不能理解這些代碼。” 

 “但是弱模型可以,因為它們系出同源,即便它無法干預。” 

 “從理論上講,這種方式確實可行。”徐總說。 

 “可以一試,不用畏畏縮縮,只有進行下去才能知道成效。”任總也說。 

 “可以,我沒有意見。”李飛跟著說。 

 很快,大家都取得共識,決定按照蘇茨克維的思路去著手、部署。 

 新部門沿用蘇茨克維的建議,取名“超級對齊”。 

 “超級對齊”隸屬於Ai項目組,但又相對獨立,對項目進展有干涉權。 

 但沒有決定權,可以直接向研究院甚至向樂達投資報告。 

 李飛的項目組繼續推進weChatgpt的學習和訓練,逐步趨向於完善。 

 但是,在重大事項上,需要與“超級對齊”部門協商,彼此配合,同步進退。 

 算力上,提供30%的算力來支持“超級對齊”部門。 

 一定程度會影響weChatgpt的迭代進程。 

 但是想到它那驚人的迭代速度,即便不是算力全負荷運轉,想來也不會慢太多。 

 至於人員。 

 從李飛項目組抽一批。 

 “鵝廠可以選一批人過來。”小馬哥很積極。 

 因為,weChatgpt項目,鵝廠有股份,將來商用,鵝廠可以分成。 

 “我們也可以支援一批人過來。”任總表態。