轉(zhuǎn)帖|行業(yè)資訊|編輯:陳俊吉|2016-06-03 09:57:31.000|閱讀 2281 次
概述:企業(yè)數(shù)據(jù)往往分布在不同的業(yè)務(wù)子系統(tǒng)中,彼此獨(dú)立,形成多個(gè)信息孤島,如果要進(jìn)行數(shù)據(jù)集成,那么企業(yè)所面臨的一個(gè)關(guān)鍵問(wèn)題就是如何高效的獲取數(shù)據(jù),同時(shí)又不用花費(fèi)太多的精力和成本?
# 界面/圖表報(bào)表/文檔/IDE等千款熱門軟控件火熱銷售中 >>
相關(guān)鏈接:
企業(yè)數(shù)據(jù)往往分布在不同的業(yè)務(wù)子系統(tǒng)中,彼此獨(dú)立,形成多個(gè)信息孤島,如果要進(jìn)行數(shù)據(jù)集成,那么企業(yè)所面臨的一個(gè)關(guān)鍵問(wèn)題就是如何高效的獲取數(shù)據(jù),同時(shí)又不用花費(fèi)太多的精力和成本?
可惜理想很豐滿,現(xiàn)實(shí)很骨感,我們的數(shù)據(jù)源可能來(lái)自于不同的數(shù)據(jù)庫(kù),例如DB2,Oracle,SQLServer,Teradata,Sybase,MySQL, Netezza; 也有可能位于不同的操作系統(tǒng)平臺(tái),例如AIX,Linux,Windows,Mainframe。那么,三個(gè)大大的疑問(wèn)將不可避免地?cái)[在我們面前:
怎么辦?項(xiàng)目還能好好的進(jìn)行下去嗎?BI系統(tǒng),數(shù)據(jù)倉(cāng)庫(kù),數(shù)據(jù)集市的建設(shè)都還指望著前期數(shù)據(jù)集成工作能早日完成呢,負(fù)責(zé)集成的攻城獅們表示壓力山大。。。
問(wèn)題總會(huì)有解決的辦法,利用DataStage便可輕松實(shí)現(xiàn)對(duì)各種異構(gòu)數(shù)據(jù)庫(kù)的訪問(wèn)和讀寫,從而讓我們能節(jié)省出更多的時(shí)間和精力去創(chuàng)造更大的價(jià)值。
是IBM統(tǒng)一數(shù)據(jù)集成平臺(tái)InfoSphere Information Server的重要組件,是業(yè)界主流的 ETL工具(Extract, Transform, Load)。
DataStage采用簡(jiǎn)單易用的圖形化設(shè)計(jì)方式,內(nèi)置豐富的功能模塊和接口,從而支持對(duì)海量數(shù)據(jù)進(jìn)行抽取、清洗、轉(zhuǎn)換和加載。同時(shí)它廣泛支持各種異構(gòu)平臺(tái)的數(shù)據(jù)源和各種類型的數(shù)據(jù)格式(結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)),具有滿足最苛刻的數(shù)據(jù)集成需求所需的功能性、靈活性和可伸縮性。
提供多種功能強(qiáng)大,類型豐富的數(shù)據(jù)庫(kù)連接器,滿足企業(yè)數(shù)據(jù)集成所需:
不僅能提供對(duì)異構(gòu)平臺(tái)數(shù)據(jù)庫(kù)的專用支持,而且還能對(duì)同一數(shù)據(jù)庫(kù)實(shí)現(xiàn)多樣化支持。例如對(duì)DB2數(shù)據(jù)庫(kù)的連接,我們建議首選功能更豐富、性能更強(qiáng)大的DB2 Connector,但也可以用JDBC Connector和ODBC Connector來(lái)實(shí)現(xiàn)。
以下是通過(guò)這三種方式連接DB2數(shù)據(jù)庫(kù)并讀取數(shù)據(jù)的具體配置過(guò)程:
DB2 Connector配置
1.首先,需要在DataStage服務(wù)器上安裝DB2數(shù)據(jù)庫(kù)的客戶端。
2.然后將DB2環(huán)境變量文件db2profile的路徑添加到DataStage服務(wù)器的dsenv文件 中。
# Add for DB2
. /home/db2inst1/sqllib/db2profile
熟悉DataStage的朋友應(yīng)該知道dsenv是DataStage的環(huán)境變量文件,每次重啟DataStage都會(huì)讀取該文件以獲得運(yùn)行時(shí)的環(huán)境變量,我們將db2profile添加至該文件的目的就是讓DataStage通過(guò)DB2自身的客戶端環(huán)境來(lái)訪問(wèn)目標(biāo)DB2數(shù)據(jù)庫(kù)。
Tips:dsenv文件位于$DataStage_Install_Directory/Server/DSEngine目錄
3.然后重啟DataStage以使環(huán)境變量生效
uv -admin -start
uv-admin –stop
4.接下來(lái),打開DataStage Designer(DataStage客戶端,用于設(shè)計(jì)開發(fā)ETL作業(yè)), 配置DB2Connector的屬性,輸入將要連接的DB2數(shù)據(jù)庫(kù)名,用戶名,密碼以及表名。
5.完成配置后,運(yùn)行作業(yè),即可讀取DB2表數(shù)據(jù),如下圖所示:
6.DB2 Connector提供豐富的DB2優(yōu)化選項(xiàng)和原生API功能,例如可設(shè)置根據(jù)DB2 源表的某個(gè)字段進(jìn)行Partitioned Read模式,從而獲得極大的讀取性能提升。而在JDBC Connector和ODBC Connector中,就沒有這些功能選項(xiàng)可供調(diào)優(yōu),這也是為什么DB2 Connector是連接DB2數(shù)據(jù)庫(kù)的首選原因。
JDBC Connector配置
1.首先將DB2自帶的JDBC驅(qū)動(dòng)包復(fù)制到服務(wù)器目錄中,請(qǐng)注意文件訪問(wèn)權(quán)限。
db2jcc.jar
db2jcc_license_cu.jar
2.在DataStage服務(wù)器中的新建一個(gè)名為isjdbc.config的配置文件,添加JDBC驅(qū)動(dòng)程序包和JAVA類名稱如下所示:
Tips:isjdbc.config文件位于$DataStage_Install_Directory/Server/DSEngine目錄中。
3.用JDBC Connector連接DB2數(shù)據(jù)庫(kù),不需要修改DataStage的環(huán)境變量文件dsenv,也不需要重啟DataStage。
4.接下來(lái),打開DataStage Designer客戶端,在JDBC Connector中配置將要連接DB2數(shù)據(jù)庫(kù)的URL,用戶名,密碼以及表名。
URL格式為jdbc:db2://DB2服務(wù)器IP地址:端口/DB2數(shù)據(jù)庫(kù)名
5.完成配置后,運(yùn)行作業(yè),即可讀取DB2表數(shù)據(jù),如下圖所示:
ODBC Connector配置
1.首先,修改服務(wù)器的ODBC配置文件:
$DataStage_Install_Directory/Server/DSEngine/.odbc.ini
添加連接DB2數(shù)據(jù)庫(kù)的ODBC配置信息如下:
2.配置完DB2的ODBC數(shù)據(jù)源信息后,將DB2_DSN添加到$DataStage_Install_Directo ry/Server/Projects/Project_Name/uvodbc.config文件中。
3.用ODBC Connector連接DB2數(shù)據(jù)庫(kù),不需要修改DataStage的環(huán)境變量文件dsenv,也不需要重啟DataStage。
4.接下來(lái),打開DataStage Designer客戶端,在ODBC Connector中配置DB2數(shù)據(jù)庫(kù) 的ODBC數(shù)據(jù)源(DB2_DSN),用戶名,密碼以及表名。
5.完成配置后,運(yùn)行作業(yè),即可讀取DB2表數(shù)據(jù),如下圖所示:
以上便是DataStage連接DB2數(shù)據(jù)庫(kù)的三種配置方法介紹,怎么樣,是不是感覺很簡(jiǎn)單很容易?沒錯(cuò),配置簡(jiǎn)單,容易上手,界面友好,功能強(qiáng)大,專業(yè)的ETL工具就是這么任性!
不論是專用連接器,還是JDBC連接器或ODBC連接器,都能實(shí)現(xiàn)對(duì)企業(yè)級(jí)數(shù)據(jù)庫(kù)的訪問(wèn);雖然條條道路通羅馬,但采用的方式不同,效果也就會(huì)不一樣。例如,專用連接器實(shí)現(xiàn)了對(duì)特定數(shù)據(jù)庫(kù)(DB2,Oracle,Teradata等)的接口優(yōu)化和原生API支持,可提供更快更好的處理性能,能駕馭大部分企業(yè)級(jí)的數(shù)據(jù)集成場(chǎng)景;而JDBC連接器和ODBC連接器則是通用的數(shù)據(jù)庫(kù)連接器,配置簡(jiǎn)單,容易上手,雖然性能稍弱,但兼容性很出色,不僅支持主流的數(shù)據(jù)庫(kù),還能提供對(duì)開源數(shù)據(jù)庫(kù)如NoSQL以及國(guó)內(nèi)新興數(shù)據(jù)庫(kù)的廣泛支持。總之,企業(yè)數(shù)據(jù)集成需求紛繁復(fù)雜,五花八門,DataStage可提供最全面的支持和最可靠的保障,如有機(jī)會(huì),大家可以在實(shí)際應(yīng)用中思考和體會(huì)。
想要了解更多有關(guān)的功能和數(shù)據(jù)集成場(chǎng)景嗎,請(qǐng)?jiān)L問(wèn)下面鏈接:
via:華南IBM大數(shù)據(jù)支持團(tuán)隊(duì)
詳情請(qǐng)咨詢“”!
客服熱線:023-66090381
本站文章除注明轉(zhuǎn)載外,均為本站原創(chuàng)或翻譯。歡迎任何形式的轉(zhuǎn)載,但請(qǐng)務(wù)必注明出處、不得修改原文相關(guān)鏈接,如果存在內(nèi)容上的異議請(qǐng)郵件反饋至chenjj@fc6vip.cn