[圖文]美國科學家訓練電腦分析統計果蠅行為實驗數據 | 陽光歷史

 

A-A+

[圖文]美國科學家訓練電腦分析統計果蠅行為實驗數據

2015年12月30日 科學探秘-長篇 暫無評論 閱讀 161 次

美國科學家訓練電腦分析統計果蠅行為實驗數據

模式識別中最為公眾熟悉的是對指紋的識別。



美國科學家訓練電腦分析統計果蠅行為實驗數據

果蠅是一種著名的模式生物,通過對它的研究,科學家揭示出很多基因的秘密



美國科學家訓練電腦分析統計果蠅行為實驗數據

 派羅那製造了會看錄像的機器人



  電腦已經能夠幫助人們看錄像了!近日,美國加州技術大學的科學家們訓練電腦從錄像中自動分析果蠅的攻擊和求偶行為,這開啟了大規模的基因控制行為研究的新方法。


  1 基本工作


  電腦也會「看錄像」


  這個程序可以讓電腦自動檢測半小時長度的關於果蠅間互動的錄像,它可以近乎實時地自動描述一組新培養的果蠅的行為模式,整個過程大約半小時,而人類做同樣的工作需要超過100小時。


  這個項目由加州技術大學電子工程教授佩特羅·派羅那(Pietro Perona),以及該大學的生物學教授大衛·安德森(David Anderson)共同主持。


  安德森說:「每個人都想知道基因如何控制行為,但是如果你想要對複雜的社會行為,比如攻擊和求偶的行為進行基因分析,你就需要精確的方法來測量或者統計這些行為。」


  以前,做到這件事的惟一方法是讓學生們「一遍又一遍地看錄像,每一次統計一種行為」。用這種方法來統計果蠅的一大堆行為:突刺、扭打、追逐、繞圈、交尾,甚至於確定一隻果蠅在遇到另一隻果蠅時身體和翅膀的動作,都需要讓學生們反覆看錄像,每一次確定一對果蠅的動作。「如果用這種方式確定基因變異對攻擊行為的影響,我們需要分析大約2000對果蠅,如果沒有一支『研究生軍團』,我們根本不可能做這件事。」


  這時派羅那和電子工程學博士後海科·丹科特(Heiko Dankert)及時出現,運用機器視覺和其他新工程成就來「訓練」電腦「看」和「識別」攻擊和求偶行為。結果是,一個自動系統可以在幾分鐘之內統計錄像中互動的果蠅的各類行為。


  派羅那說:「機器視覺的域運用已經有年頭了。通過選擇已經存在的機器視覺技術,我們可以做出比以往曾經驗證過的任何東西都有效的系統。」


  2 發展目標


  最終目標研究「人」


  這個小組先「喂」給電腦一些特定的果蠅動作的視訊,比如「突刺」的動作,就是果蠅先縮短身體,然後突然彈開身體,跳到離另一隻果蠅幾厘米遠的地方。


  當電腦掌握了這些細節,研究者會比較同一段錄像機器分析的結果和人工分析的結果,安德森說:「我們要看電腦抓住了多少次,錯過了多少次,通過查看電腦犯下的錯誤,我們可以更好地完善我們的描述,從而創造一個更精確的體系」。最後,這種「千錘百煉」的自動程序比人工統計還要準確!


  而派羅那表示,以前的實驗錄像中只有100到1000幀圖像,而現在的實驗錄像中可以有10萬幀圖像,以前的實驗會犯很多計數上的錯誤,而我們的錯誤非常少,我們可以給出非常準確的統計數據。


  安德森說,下一步,他們將把這種自動行為統計方法擴展到老鼠實驗中。比起果蠅,哺乳類的行為更加模糊,更不容易用機器識別。為什麼要費這個勁呢?因為科學家們不僅僅想瞭解基因對果蠅行為的影響,他們最終要瞭解基因對人類行為的影響,那麼就一定要研究小白鼠的行為。


  派羅那說:「我們的視覺系統可以告訴我們很多關於其他人在幹什麼的信息———誰在吃東西,誰在打人,誰在臉紅,誰泡到了女生或者勾到了男生,我們的領域『計算機視覺』的最終目標是設計一個機器,能夠探測和理解人類的動機和行為。為了達到這個目的,我們需要從更簡單的生命體開始。安德森給我展示了果蠅的行為是多麼豐富和有趣,所以我們開始合作。」


  安德森補充說:「現在我們可以從這些視訊中『擠』出很多信息,它有助於我們理解是什麼控制著果蠅的社會互動行為,它讓我們現在可以研究以前根本不可能研究的東西。」


  3 相關技術


  模式識別是關鍵


  機器視覺就是將計算機視覺的方法運用到工業生產和其他實際操作中。計算機視覺主要集中在基於電腦的圖像處理,機器視覺往往還需要數字輸入/輸出設備和計算機網絡,以控制其他的設備,比如說機器手臂。機器視覺融合了電腦科技、光學、機械工程和工業自動化等領域。比較簡單的機器視覺可以做的事情包括快速檢驗生產出來的罐頭、針管是否合格、迅速讀取零件上的標碼、尋找機器周圍遺落的螺釘等等。而在「果蠅」的例子中,機器視覺重點應該還是在計算機視覺的領域。


  機器視覺和兩個概念息息相關,一個是「計算機視覺」,另一是「圖像處理」,這三者之間有著密切的聯繫,之間的界限非常模糊,經常被混為一談。實際上,在「訓練電腦研究果蠅」這個例子中,三個領域的成果都有重要的應用,研究人員在接受採訪的時候只說「機器視覺」僅是一種簡化說法而已。


  圖像處理指用計算機對圖像進行分析和處理,以達到所需結果的技術。圖像處理包括圖像的壓縮、圖像的增強和復原,以及圖像的匹配、描述和識別這三個部分。北京理工大學模式識別副教授吳曉兵說,要實現機器視覺,應當首先對圖像進行增強、去噪聲、方向濾波等方面的處理。我們在好萊塢電影中,看到特工人員把一幅模糊的錄像截圖,迅速地轉化成一幅清晰的人像照片。吳曉兵說,這就是對圖像的「銳化」,是圖像處理的一種。當然,電影中對機器的這種能力有所誇大,銳化只能部分改善圖片質量,不可能達到這麼好的效果。而圖像處理最前沿的部分是「模式識別」。在一個定義中,模式識別是通過以往的知識,或者通過從模式中提取的常數來對數據進行歸類的技術。


  聽起來很費解,但是其實「模式識別」在我們的生活中時時需要用到,有簡單點的,比如一堆豆子裡找到壞掉的豆子,也有很難的,比如在參加酒會的人群裡找到可以搭訕的對象。可以說,模式識別是人類的一項基本智能,但是讓機器學會這個本事可就費老勁了。吳曉兵說:「模式識別就是要告訴你『目標圖像是什麼』。」


  4 實際應用


  人臉識別很典型


  人臉識別是最典型的模式識別。吳曉兵說。首先要做的是在一個圖像中找到人臉。人臉一般是橢圓形的,機器容易辨認,然後在臉上找到眼、鼻、嘴等器官。這些器官和周圍的其他東西的對比度是不一樣的,而且位置比較固定,所以容易找到。即使臉稍微模糊一點,或者角度略偏一點,機器也可以識別。


  下一步是識別這張臉是誰的臉。機器可以通過矩陣運算來對比圖片上的臉和目標庫裡的臉在像素上的相似度,也可以通過選定的特徵點進行比較。不過,現在人臉識別並未特別廣泛地運用,除了像奧運安檢這樣的特殊場合,這種技術不常使用。這是因為人臉比較複雜,不容易識別———在圖片畫面比較雜亂的情況下經常有誤認的情況,比如把樹皮誤認為人臉———其實這種現象在人類視覺裡也經常出現。至於像著名美劇《越獄》中表現的,通過衛星圖像來確定一個人的臉,現在是根本不可能的。相比起來,指紋識別是更簡單的模式識別。人類覺得認出人臉比認出指紋容易,但電腦的看法正相反,所以指紋識別的運用很廣泛。


  那麼,電腦能識別人的表情嗎?吳曉兵說,對於一個特定的人來說這個技術實現很容易,前提是要建立這個人各種表情的資料庫,但是現在還無法做到用機器對任意一個人的表情進行識別。


  至於加州技術大學的機器視覺運用,吳曉兵表示這並不算難。電腦可以通過將一幀圖像和上一幀圖像相比較來確定運動的趨勢,這在受控的實驗室背景下相當容易實現。北京理工大學曾經實驗開發過一段足球錄像搜尋系統,可以自動找到進球片段,運用的就是類似的技術。


  機器視覺的未來是什麼?吳曉兵說,未來想要達到的是機器對圖像的理解。比如機器人看到一段樓梯,它能夠理解其中的空間關係,並且決定是否上樓,當然,這其中已經包含人工智能的成分了。





給我留言