Apache NiFi:讓你輕鬆建立Data Pipeline

點閱:3

其他題名:讓你輕鬆建立Data Pipeline

作者:蘇揮原作

出版年:2023

出版社:碁峰資訊股份有限公司

出版地:台北市

格式:PDF,JPG

頁數:266

ISBN:9786263244160

EISBN:9786263245099 PDF

分類:資管網通  

 ‧精簡的設定和範例介紹,快速掌握Apache NiFi核心精髓
  ‧整合當今主流的資料工程架構與相關服務說明
  ‧掌握資料流設計的特性與重點,踏出資料工程第一步

  本書介紹Apache NiFi這套服務工具,讀者可以於該服務設計自動化處理資料流(Data Pipeline)。所有的設計與設定都是以No Code與WEB UI方式處理,具備強大的操作互動性和易用性。另外支援大多數的資料載體,如:Relational Database、Document DB、Column-Based、DataWarehouse 、Message Queue等對接處理,並支援目前主流的三大雲平台-AWS(Amazon Web Service)、GCP(Google Cloud Platform)和Microsoft Azure,涵蓋大部分企業使用到的應用與服務,都可透過Apache NiFi做到一站式整合與資料流設計,確保資料處理邏輯以及流入和流出的方向和目的地。同時在面對大量資料處理時也可以運用高擴展的特性來平行執行,也能更細節地去追蹤資料的變化與狀態,最後做到完整的流程與錯誤控制以避免產生資料遺漏的窘境。

  本書會介紹當今在資料工程常見的架構,接著介紹Apache NiFi的架構與元件、建置流程與設定、操作方式、與外部服務的整合和應用、資料追蹤等各個資料工程常見的應用處理。最後會提及資料工程領域的發展和重點分析,讓對於這塊領域較陌生或有興趣的讀者們,除了可以在本書學到Apache NiFi的核心價值之外,也能意識到該領域的後續發展與重點,給予讀者具體方向進行未來的發展和準備。
作者簡介

蘇揮原 Mars Su

  畢業於國立臺灣科技大學資管所,目前於趨勢科技(TrendMicro)擔任Staff Data Engineer,參與過Streaming Data Pipeline架構設計與開發,以及NLP應用處理,熱衷於資料工程和機器學習等領域的研究與探索。

  過往曾獲得iTHome 2021鐵人賽AI&Data組冠軍以及擔任過PyCon APAC 2022講者。