集微網報道,1991年誕生于美國硅谷的普迪飛半導體技術有限公司(PDF Solutions,下稱“普迪飛半導體”)過去30年來一直專注于做一件事——幫助半導體全產業鏈挖掘數據價值。到目前為止,該公司的全球半導體數據庫中的數據量已經超過4000 TB,相當于可以“看五百多年的電影”。
數據大爆炸席卷全球工業,成為各行各業新的“生產資料”。數字化浪潮在工業領域的滲透也是全球產業大升級的必經之路。然而在數據密集型的半導體產業,在使用大數據分析應用上卻是相對落后的?,F在必須快速補上這一環。
“越來越多的半導體公司,包括國內大量‘年輕’的Fabless,開始意識到數據分析的重要性。這是半導體產業從基礎建設1.0時代邁向質量提升的2.0時代的關鍵一步?!逼盏巷w半導體亞太區副總俞冠源日前在接受集微網專訪時這樣指出。
“爆炸式”增長的半導體大數據如何互聯?
根據IDC的統計,2019全球數據量達到42ZB,預計2022年達到163ZB,復合增速為57%。但是在這些海量數據真正產生對產業有價值的洞察之前,大量的基礎工作尚未完善。
比如,工業數據在采集過程中會遇到數據完整性、數據質量等方面的困難,這就需要進行工況分割、數據清洗、數據質量檢測、數據樣本平衡、數據分割等數據預處理,這些工作本身就會耗費大量的時間和人力成本。
這一點,在數據密集型的半導體行業尤為突出。俞冠源指出,半導體大數據最大的問題是數據種類很多,如果不能很好整合,就會使數據雜亂無章?!靶〉揭黄琖afer上都有很多種數據,從IC設計到制造再到封測,每一道工序都產生大量數據,而這些散落在各個環節的大數據也是此后追溯問題、提升良率的關鍵?!?/p>
與其他工業相比,半導體產業鏈極其長且高度細分,從芯片設計到晶圓制造,再到封裝、測試、PCB模板,然后再做成產品進入到實際應用場景,每一步都是由一大批專門的公司去做。
“這種高度成熟的全球水平分工模式是造就半導體產業過去幾十年高速發展的重要產業架構。但各個環節相對獨立讓各自的數據很難串聯在一起。”俞冠源說,“事實是,半導體公司要做數據分析,幾乎90%的時間花在前期的數據清洗和數據整合上?!边@讓試圖引入數據分析手段的半導體公司在具體操作層面遇到了實際難題。
此外,到了數據分析層面,缺乏有效的數據分析經驗和手段也是國內很多Fab和Fabless面臨的困難?!芭c高通、AMD、英特爾等老牌企業相比,很多國內廠商相對而言都還比較年輕,成立時間不長,缺乏相關經驗,拿到數據以后,對于哪些數據要整合,哪些分析能夠幫助他們抓住問題,往往容易迷茫。”俞冠源指出。
而上述各種障礙的根源在于,整個行業數據相關的底層架構未搭好。俞冠源比喻,這就相當于造房子時,底層的地基、水管、電線都要線架設好,尤其是數據清理、數據整合的部分,需要一個可供全行業使用的開放平臺去提前做好,可以為需要導入數據分析應用的公司提供有效的分析手段。
“一直以來我們在底層架構的部分做了很多工作,也就是努力把‘水管、電線’都鋪設好,幫助企業可以‘拎包入住’,直接實現數據價值。”俞冠源介紹,普迪飛所提供的Exensio平臺正是為此而生。
據了解,普迪飛的端到端分析平臺Exensio平臺,具備了大數據整合,清洗與分析功能,可以為整個產業鏈上的各種公司提供服務。如果將整個產業鏈以設計、晶圓制造和封裝測試三大環節來劃分,針對每一環節的特性,普迪飛均有對應的產品模塊。
迄今為止,在IC設計部分,普迪飛的Fire Engine軟件分析了10億計的版圖結構;在晶圓制造環節,全球超過24,000臺芯片生產設備通過其提供的生產監控軟件進行連接;封裝測試部分,全球超過15個主要封測服務提供商的工廠數據與該平臺對接,超過16,000臺測試機和封裝設備通過其監控整個運營情況的軟件相聯接。
更為重要的是,通過這樣一個連通全產業鏈的數據平臺,原本獨立分工的各個產業鏈環節實現數據層面的互聯。而這種互聯不僅僅只是設備間的,同時也將各個環節的半導體工程師與所有的芯片生產、封裝、測試設備連接起來,為設計和制造提供重要的參考,有助于降低各項成本,提高性能和良率。
普迪飛在過去30年里,與國際一流的流片廠及設計公司密切合作,幫助先進 Fab、Fabless、IDM/System等國際領先的半導體公司完成了眾多先進工藝量產項目。
打通產業鏈上下游挖掘數據價值
俞冠源指出,目前普迪飛是唯一一家覆蓋了從前端到后端半導體供應鏈數據的公司,通過幾十年的自身積累和對外并購,已經打通了整個供應鏈。在他看來,對產業鏈的端到端全覆蓋是普迪飛的核心價值。
他舉了一個例子,蘋果公司對其芯片供應商就要求其提供的每一顆芯片都是可追溯的——哪一個工廠生產的,工廠的每一個步驟是什么,包括制造過程中用到的化學氣體,在哪臺設備上測試、封裝的,哪一個員工負責的,等等。因為只有追蹤到才能夠確認哪個步驟出了問題。
俞冠源解釋,這種端到端全產業鏈的數據分析之所以越來越關鍵,是由于半導體在全球范圍內對各個行業的重要程度逐年遞增——半導體在產品中占比越來越高,對其可靠性的要求也越來越高?!氨热缙?,以前最貴的部件是發動機,到如今,最貴已經是半導體元器件。并且元器件的可靠性越來越重要,即便是幾塊錢的元件,如果壞掉了,也可能會引發交通事故,甚至會對人的生命造成影響?!?/p>
換句話說,幾塊錢的元件,會影響幾十萬的整車價值?!耙蚨雽w的可靠性越來越重要,如果良率、可靠性出了問題,需要明確追溯到問題是在哪個環節出來的,是封裝還是制造環節,還是IC設計的缺陷?!?/p>
而到了半導體先進工藝節點,尤其在下探到7nm、5nm時,因為隨著工藝復雜度的提升,很多缺陷都不在表面上,而是埋在里面。怎樣在研發和量產時監控這些東西,變得十分困難。因而提升良率除了從技術上調整之外,數據抓取能力的重要性越來越突出。
俞冠源介紹,先進節點的良率提升已經不僅僅是晶圓廠考慮的事,Fabless也需要在產品設計的時候,就把監控結構埋在產品里面,通過特征數據的抓取及高效分析來快速準確地定位問題,提高產品良率。
在這一部分,普迪飛在與世界一流芯片設計公司以及晶圓廠近30年的合作中,積累了大量不斷演進的良率提升技術。例如,可以幫助先進制程客戶設計獨特的監控結構,內置于芯片的空閑位置,并結合普迪飛專用測試設備,實現大量特征數據的超高速抓取和分析,從而使得設計和工藝的缺陷一目了然。
具體來看,普迪飛的半導體大數據平臺Exensio Platform,包含了用于半導體缺陷偵測分類(Fault Detection and Classification, Exensio-Control)模塊、產品測試優化模塊(Exensio-Test)、半導體良率管理系統模塊(Exensio-Yield)等,覆蓋了從IC設計、晶圓制造,到封裝和測試等的半導體全產業鏈。
擁抱AI、數據上云勢在必行 預見性分析是趨勢
俞冠源介紹,目前半導體公司在大數據分析上,最關注的是良率診斷分析,也就是出現問題后可以通過系統的方法快速追蹤問題源頭,從而進行診斷分析,改善良率。
但是隨著全行業智能化程度的深入,這種被動式應對長遠來看顯然無法滿足需求。在問題發生之前的預見性分析成為更多業界領先者關注的重點。
一兩年前,臺積電就曾表示,已經在工廠里開始使用人工智能,在人工智能的幫助下,能夠在不增加機器的情況下多生產20%-30%的wafer。例如,在某些關鍵工序上,使用人工智能對機臺的保養時間動態的做出調整,提高生產效率。另外,人工智能還可以將很多專家的經驗和專業技能整合在一起,讓一個專家的經驗在不需要專家在場的情況下就能大面積的鋪開使用,從而實現更好的經驗傳承。
“下一步要做的事情就是預見,通過AI、機器學習等手段,從數據里面提出價值,來預防可能發生的問題。”俞冠源說。
比如,以晶圓廠為例,普迪飛的Process Control軟件其中有一部分功能就是監測機臺設備,通過收集的過往數據來分析預測機器大約會在運作多少個小時之后可能會出現問題,導致生產的wafer報廢。這樣就可以提前讓機器停下來檢修。而以往,都是等到機器開始生產報廢的wafer了,才會停下設備。但往往停下來的時候可能已經生產了一部分報廢的wafer。
隨著AI、機器學習、5G等技術的往前發展,數據量呈指數式增長,按需運算的需求越來越高。上云以獲取更靈活的計算資源和存儲優勢,成為業界向工業4.0深入的必然選擇。
俞冠源以一片wafer為例,先進工藝制程的引入,一片wafer產生的數據量可能是原來的10倍乃至100倍。與此同時,AI、機器學習的引入意味著巨大的計算量,數據存儲空間、計算能力的要求與日俱增,全靠一家公司內部架構支撐顯然不現實。
上云已經成為先進制造行業的核心之一,但是國內半導體行業對此仍有所保留。其中數據的安全性是晶圓廠和設計公司最大的顧慮。俞冠源認為這其中存在著一個誤區,“大家都認為數據放在自己公司比放在云端安全。實際上,一個半導體公司不是純IT公司,在安全方面的人力投入上遠不如云服務商。這些云服務商都會提供多重安全架構,足以為客戶數據筑起強大的屏障?!?/p>
據悉,普迪飛推出的DEX網絡已經幫助全球主要封測廠實現了云端部署和邊緣計算,包括通過邊緣分析來實現快速預測和預測響應,減少數據丟失,提升數據質量。
據介紹,普迪飛除了與全球知名的云服務商,如AWS等密切合作外,還在軟件中做了很多保障數據安全的措施,并聘請了很多安全公司進行模擬入侵測試。
值得一提的是,2006年即進入中國市場的普迪飛,在過去15年里,業務模式隨著中國半導體行業的發展逐步升級。俞冠源介紹,國內半導體行業在工藝方面一直在更新換代,芯片設計公司是成長最快的群體。針對芯片設計公司的特點,普迪飛此前推出了基于云端部署的Exensio-Hosted半導體數據分析平臺,是一款不需要任何IT維護的企業級云端數據分析系統,可以讓客戶隨時隨地存取數據,完成定制化的數據分析,快速查找問題根源。該平臺可以兼容多種數據,支持高效數據提取與加載,提供高度交互的數據可視化模塊,還有快速報警、深度追蹤以及強大的數據挖掘能力。