第463章 超級對齊
但有道理,也可以去實踐。
就像老師與學生的關係。
老師的能力並不一定比學生強,但是老師可以監督、指導、引導學生。
“我們希望通過弱模型來監督強模型,讓強模型對人類始終抱有溫和、溫暖而積極的情感。”蘇茨克維說。
常樂看向小馬哥。
小馬哥覺得可以。
“弱模型的能力可以不比強模型強,但是可以理解並監督強模型的行為,引導它在規則和範式內運行。”小馬哥是這麼理解的:
“必要時可以及時向人類發出預警,便於做出針對的有效舉措。”
“譬如,強模型按照它的理解編寫數百萬行、且具有危險性的代碼,而人類並不能理解這些代碼。”
“但是弱模型可以,因為它們系出同源,即便它無法干預。”
“從理論上講,這種方式確實可行。”徐總說。
“可以一試,不用畏畏縮縮,只有進行下去才能知道成效。”任總也說。
“可以,我沒有意見。”李飛跟著說。
很快,大家都取得共識,決定按照蘇茨克維的思路去著手、部署。
新部門沿用蘇茨克維的建議,取名“超級對齊”。
“超級對齊”隸屬於Ai項目組,但又相對獨立,對項目進展有干涉權。
但沒有決定權,可以直接向研究院甚至向樂達投資報告。
李飛的項目組繼續推進weChatgpt的學習和訓練,逐步趨向於完善。
但是,在重大事項上,需要與“超級對齊”部門協商,彼此配合,同步進退。
算力上,提供30%的算力來支持“超級對齊”部門。
一定程度會影響weChatgpt的迭代進程。
但是想到它那驚人的迭代速度,即便不是算力全負荷運轉,想來也不會慢太多。
至於人員。
從李飛項目組抽一批。
“鵝廠可以選一批人過來。”小馬哥很積極。
因為,weChatgpt項目,鵝廠有股份,將來商用,鵝廠可以分成。
“我們也可以支援一批人過來。”任總表態。