機(jī)器學(xué)習(xí)開始預(yù)測人類生活多個(gè)方面
《自然·計(jì)算科學(xué)》18日發(fā)表的一項(xiàng)研究描述了一個(gè)機(jī)器學(xué)習(xí)方法,該方法能從不同方面準(zhǔn)確預(yù)測人類生活,包括早死可能性和個(gè)性的細(xì)微差異。該模型或能提供對人類行為的量化認(rèn)知。
社會科學(xué)家對人類生活是否能被預(yù)測的問題看法不一。雖然人們對起到重要作用的社會人口學(xué)因素已有充分了解,但卻一直無法對生命結(jié)局進(jìn)行準(zhǔn)確預(yù)測。
利用丹麥國家登記處約600萬人的教育、健康、收入、職業(yè)和其他生活事件數(shù)據(jù),丹麥技術(shù)大學(xué)研究團(tuán)隊(duì)設(shè)計(jì)了一個(gè)機(jī)器學(xué)習(xí)方法,以構(gòu)建個(gè)體的人類生活軌跡。團(tuán)隊(duì)通過調(diào)整語言處理技術(shù),用類似模型中語言的方式表達(dá)人類生活。這種方法能以類似語言模型捕捉詞語間復(fù)雜關(guān)系的方式生成一個(gè)生活事件的術(shù)語表。他們提出的模型名為“life2vec”,能確定健康相關(guān)診斷、居住地、收入水平等概念之間的復(fù)雜關(guān)系,并用一個(gè)壓縮向量編碼個(gè)人生活,以此作為預(yù)測生活結(jié)局的基礎(chǔ)。
研究團(tuán)隊(duì)證明,該模型可預(yù)測早死率,即年齡組在35歲至65歲的個(gè)體自2016年1月1日起存活4年的概率。另外,其捕捉細(xì)微個(gè)性差異的能力超過了當(dāng)下先進(jìn)的模型和基線標(biāo)準(zhǔn),表現(xiàn)至少提升11%。
研究結(jié)果表明,通過表征社會結(jié)局和健康結(jié)局之間的復(fù)雜關(guān)聯(lián),準(zhǔn)確預(yù)測生活結(jié)局也許是可以做到的。但團(tuán)隊(duì)也強(qiáng)調(diào),他們的研究只是對可能性的探索,而且只應(yīng)在確保個(gè)人權(quán)利受到保護(hù)的監(jiān)管下才可用于現(xiàn)實(shí)世界。 (記者 張夢然)
《自然·計(jì)算科學(xué)》18日發(fā)表的一項(xiàng)研究描述了一個(gè)機(jī)器學(xué)習(xí)方法,該方法能從不同方面準(zhǔn)確預(yù)測人類生活,包括早死可能性和個(gè)性的細(xì)微差異。該模型或能提供對人類行為的量化認(rèn)知。
社會科學(xué)家對人類生活是否能被預(yù)測的問題看法不一。雖然人們對起到重要作用的社會人口學(xué)因素已有充分了解,但卻一直無法對生命結(jié)局進(jìn)行準(zhǔn)確預(yù)測。
利用丹麥國家登記處約600萬人的教育、健康、收入、職業(yè)和其他生活事件數(shù)據(jù),丹麥技術(shù)大學(xué)研究團(tuán)隊(duì)設(shè)計(jì)了一個(gè)機(jī)器學(xué)習(xí)方法,以構(gòu)建個(gè)體的人類生活軌跡。團(tuán)隊(duì)通過調(diào)整語言處理技術(shù),用類似模型中語言的方式表達(dá)人類生活。這種方法能以類似語言模型捕捉詞語間復(fù)雜關(guān)系的方式生成一個(gè)生活事件的術(shù)語表。他們提出的模型名為“life2vec”,能確定健康相關(guān)診斷、居住地、收入水平等概念之間的復(fù)雜關(guān)系,并用一個(gè)壓縮向量編碼個(gè)人生活,以此作為預(yù)測生活結(jié)局的基礎(chǔ)。
研究團(tuán)隊(duì)證明,該模型可預(yù)測早死率,即年齡組在35歲至65歲的個(gè)體自2016年1月1日起存活4年的概率。另外,其捕捉細(xì)微個(gè)性差異的能力超過了當(dāng)下先進(jìn)的模型和基線標(biāo)準(zhǔn),表現(xiàn)至少提升11%。
研究結(jié)果表明,通過表征社會結(jié)局和健康結(jié)局之間的復(fù)雜關(guān)聯(lián),準(zhǔn)確預(yù)測生活結(jié)局也許是可以做到的。但團(tuán)隊(duì)也強(qiáng)調(diào),他們的研究只是對可能性的探索,而且只應(yīng)在確保個(gè)人權(quán)利受到保護(hù)的監(jiān)管下才可用于現(xiàn)實(shí)世界。 (記者 張夢然)