隨著人類逐步進入大數據時代,海量的數據處理對現有軟硬件系統提出了更高的要求。利用Hadoop構建的處理海量數據的分布式系統具有高容錯性、可伸縮性、低成本和良好擴展性等特點。盡管目前大數據技術還未形成統一標準,但業界已經廣泛使用Hadoop分布式系統作為云計算平臺。
Hadoop關鍵技術主要涉及分布式文件系統HDFS、分布式并行計算模型MapReduce和分布式數據庫HBase。目前互聯網領域的Web搜索、廣告系統、數據分析、機器學習、網頁數據挖掘等許多任務都已經在Hadoop平臺上運行。目前,Hadoop平臺的用戶包括雅虎、臉譜、亞馬遜、百度、阿里巴巴等多家互聯網巨頭。因此,與Hadoop平臺相關的技術研究也成為計算機行業的研究熱點。
本文基于Hadoop平臺的專利申請數據來自中國專利檢索系統文摘數據庫,檢索日期截至2015年6月8日。檢索結果顯示,申請人共在中國提交了700件專利申請。從圖1可以看出,該領域的專利申請量呈現逐年增長的態勢(由于專利申請公開存在滯后性,2014年和2015年的專利申請數據并不完全)。2011年之前是Hadoop平臺的發展初期,在這期間,與Hadoop平臺相關的專利申請量只有18件;2011年,Hadoop平臺推出了1.0.0版本,標志著其已經初具生產規模,自2011年起,與Hadoop平臺相關的專利申請量迅速增長,2012年的專利申請量超過100件;2012年至今是Hadoop平臺的快速發展期,隨著云計算的興起,Hadoop作為重要的開源云計算技術成為當前的研究熱點,其專利申請量也呈逐年增長態勢。
筆者針對基于Hadoop平臺的專利申請人進行了分析。該領域排名前十位的申請人均為國內企業和高校,其中,專利申請量最多的是浪潮電子信息產業股份有限公司,排名第二位和第八位的申請人分別為浪潮(北京)電子信息產業有限公司及浪潮集團有限公司,可見,“浪潮集團”在該領域的專利申請量具有明顯優勢。究其原因,這與浪潮集團的研發方向相關,浪潮集團是國內領先的云計算、大數據服務商,Hadoop作為重要的云計算技術,也成為了浪潮集團的技術研發熱點。浪潮集團在該領域的專利申請主要涉及Hadoop平臺的應用研究,如云存儲、數據查詢、數據分析等。該領域排名前十位的申請人中,國內高校占據了半壁江山,排名第三位、第四位、第五位、第九位、第十位的申請人分別是西安交通大學、南京大學、浙江大學、華中科技大學和河海大學,這說明Hadoop技術不僅吸引了企業的關注,還引發了高校的研究熱潮。這些高校提交的專利申請不僅涉及Hadoop平臺的應用研究,如云存儲、具體領域的平臺搭建等,還涉及Hadoop平臺的理論研究,如任務調度研究、性能優化研究等。排名第六位的申請人是百度在線網絡技術(北京)有限公司,其專利申請主要涉及系統測試和數據處理。排名第七位的申請人是國家電網公司,其專利申請主要涉及與電力領域相關的Hadoop平臺的應用。
隨著大數據時代的到來,Hadoop的開源性、高容錯性、良好擴展性等特點使其成為了構建云平臺的首選技術,因此,Hadoop也成為了國內企業和高校的研發熱點,并在該領域進行了相應的專利布局。筆者認為,盡管Hadoop受到了很多人的青睞,但其發展時間較短,技術研究還不夠深入,還有很多值得改進的地方。此外,由于Hadoop在國內應用時間不長,以Hadoop為基礎,設計和開發高效率的數據處理平臺還需要進行深入研究。目前,很多用戶在使用Hadoop平臺時,已經開始著手增強和優化現有技術,因此,Hadoop的性能優化和功能增強等將是未來的主要研究方向。筆者建議,國內企業和高校應針對Hadoop平臺的性能優化、功能增強等加大技術研發力度,并有針對性地進行專利布局。(來源:國家知識產權局官網)