翻譯|使用教程|編輯:莫成敏|2019-08-06 16:35:38.330|閱讀 317 次
概述:本篇文章主要介紹LEADTOOLS如何在eDiscovery應(yīng)用程序中工作的后半部分內(nèi)容,現(xiàn)在就跟著小編來了解一下文章內(nèi)容吧~
# 界面/圖表報表/文檔/IDE等千款熱門軟控件火熱銷售中 >>
LEADTOOLS Document Imaging Suite SDK是LEADTOOLS SDK中各種特點(diǎn)的精選組合,它用于在企業(yè)級文檔自動解決方案中建立端到端的文檔圖像應(yīng)用程序,而這些文檔圖像應(yīng)用程序需要有捕捉、表格識別和處理、存檔、注釋和顯示功能。
點(diǎn)擊下載LEADTOOLS Document Imaging Suite SDK免費(fèi)版
本篇文章主要介紹LEADTOOLS如何在eDiscovery應(yīng)用程序中工作的后半部分內(nèi)容,想了解前面的內(nèi)容請點(diǎn)擊這里,現(xiàn)在就跟著小編來了解一下文章內(nèi)容吧~
Adobe Portable Document Format是迄今為止最流行的存儲文檔的文件格式,并有充分的理由。PDF易于閱讀、可搜索、充滿元數(shù)據(jù),并且可以使用注釋和標(biāo)記。它的使用如此普遍,以至于由于需要某種閱讀器或插件而擔(dān)心是否能夠加載文件在很大程度上是沒有實(shí)際意義的。盡管如此,除了前面提到的通過OCR創(chuàng)建PDF之外,為什么eDiscovery應(yīng)用程序開發(fā)人員應(yīng)該使用LEADTOOLS呢?
LEADTOOLS包含一個完整的PDF SDK,它不僅可以通過OCR創(chuàng)建可搜索的PDF。在eDiscovery過程中,可搜索文本可能是PDF的最大優(yōu)勢,但不幸的是,該功能通常僅限于查看器應(yīng)用程序。在需要分析數(shù)千個文檔的情況下,打開每個單獨(dú)的文件既乏味又容易出錯。LEADTOOLS允許開發(fā)人員為文檔、元數(shù)據(jù)、注釋、超鏈接等解析PDF文檔結(jié)構(gòu),從而可以在很短的時間內(nèi)搜索相關(guān)ESI的PDF文件的整個文件夾或磁盤驅(qū)動器。
文檔轉(zhuǎn)換器和文檔查看器
文檔轉(zhuǎn)換是eDiscovery過程中是一種非常常見的需求,因?yàn)槊總€案例都不同,每個客戶和訴訟人都會有各種條款來共享文檔。ECM可以將所有內(nèi)容存儲為PDF,但商定的生產(chǎn)格式可以是DOC。
LEADTOOLS包含一個文檔轉(zhuǎn)換器庫,可以在各種文檔格式之間進(jìn)行轉(zhuǎn)換,包括PDF、PDF / A、DOC / DOCX、XLS / XLSX和PPT / PPTX,而不需要OCR。這種獨(dú)特的區(qū)別對于eDiscovery來說是一個巨大的好處,因?yàn)樗鼭M足了保存要求,同時還簡化了處理、審查、分析和生產(chǎn)。文檔轉(zhuǎn)換器還可以接受超過150多種非文檔格式,如TIFF、JPEG、PNG和BMP,并使用OCR將這些圖像轉(zhuǎn)換為PDF圖像文本,使其成為完美且程序友好的文檔規(guī)范化工具。
與文檔轉(zhuǎn)換器密切相關(guān)的是文檔查看器。從表面上看,適用于.NET和JavaScript的文檔查看器實(shí)現(xiàn)了豐富的PDF查看應(yīng)用程序(如Acrobat Professional)所包含的許多功能:搜索和選擇文本、跟蹤書簽、添加和編輯注釋以及基于矢量的高質(zhì)量縮放,可在任何比例因子下進(jìn)行平滑渲染。與文檔轉(zhuǎn)換器結(jié)合使用時,文檔查看器實(shí)際上將自己與文檔轉(zhuǎn)換器分開。它們共同提供即時文檔規(guī)范化,可以查看、搜索和注釋150多種文檔和圖像格式。基于云的存儲和查看正逐漸被許多法庭所接受,LEADTOOLS JavaScript文檔查看器是一個完美的版本,幾乎可以查看任何原生格式的文檔,具有與基于文本的PDF相同的所有功能。
圖1:.NET應(yīng)用程序中的LEADTOOLS文檔查看器,顯示頁面縮略圖、注釋和可搜索的文本。
注釋和標(biāo)記
注釋和標(biāo)記可以在EDRM的許多階段出現(xiàn)。注釋存在于圖像或文檔頂部的圖層中,可以為文檔注入額外信息,并鼓勵協(xié)作和通信。便簽、箭頭和高亮顯示可以引起對文檔重要部分的注意。
對于合法行業(yè)而言,最重要的注釋可能是bates郵票、編輯和加密。貝茨郵票在法庭上歷史悠久,依次在紙質(zhì)文件上加蓋印花,以作識別之用。數(shù)字ESI也不例外,而且LEADTOOLS注釋使得文檔被導(dǎo)入ECM或轉(zhuǎn)移到新的存儲磁盤進(jìn)行生產(chǎn)時,很容易在文檔上覆蓋連續(xù)數(shù)字。編輯使用黑色矩形來掩蓋不應(yīng)在法庭上泄露的敏感信息。帶注釋的數(shù)字編輯是有益的,因?yàn)樗恍枰獙υ糆SI進(jìn)行任何更改。編校注釋甚至可以通過密碼撤消,根據(jù)用戶的訪問層提供不同數(shù)量的信息。加密對象與編校的工作方式類似,但它打亂了圖像下面,而不是隱藏它。
圖2:LEADTOOLS Bates郵票屬性對話框
虛擬打印機(jī)
在某些情況下,ESI難以處理,因?yàn)樗砸环N僅在遺留應(yīng)用程序或定制開發(fā)系統(tǒng)中使用的格式保存的。值得慶幸的是,絕大多數(shù)應(yīng)用程序都具有某種形式的打印功能,但許多法律團(tuán)隊并不使用它們。虛擬打印,也稱為打印到文件驅(qū)動程序,是一種經(jīng)常被忽略的解決方案,有助于防止打印到紙張的麻煩,然后使用掃描儀將其導(dǎo)入可接受的電子格式。
LEADTOOLS虛擬打印機(jī)通過從任何應(yīng)用程序捕獲打印作業(yè)并將其轉(zhuǎn)換為LEADTOOLS支持的格式(包括可搜索的PDF、DOC和TIFF),提供獨(dú)特的全能解決方案。虛擬打印機(jī)還支持添加注釋,允許開發(fā)人員創(chuàng)建工作流程,通過將文檔規(guī)范化為適當(dāng)?shù)腅SI并在整個過程中對其進(jìn)行標(biāo)記,可以同時解決多個目標(biāo)。
希望文章內(nèi)容對您有所幫助~
想要購買該產(chǎn)品正版授權(quán),或了解更多產(chǎn)品信息請點(diǎn)擊
掃描關(guān)注慧聚IT微信公眾號,及時獲取最新動態(tài)及最新資訊
本站文章除注明轉(zhuǎn)載外,均為本站原創(chuàng)或翻譯。歡迎任何形式的轉(zhuǎn)載,但請務(wù)必注明出處、不得修改原文相關(guān)鏈接,如果存在內(nèi)容上的異議請郵件反饋至chenjj@fc6vip.cn