| 直抜★シリーズ FreeWare! | |||
| 直抜★シリーズはDocuWorksからデータを抜き取るソフトの総称です。 現在、ImageとTextがあります。 シリーズ化を予定しています...が2つ以外思いつきません。(^^! |
|||
| 直抜ImageEx★ for DocuWorks FreeWare!! |
|||
| Ver0.14 | WinXp・Win2K・WinMe・Win98 | ||
| ■ 本ソフトは、DocuWorks*1)の文書ファイル(xdw*2)のうちイメージで構成されたもの(以下ImageXdwと略)からイメージを抜き取るソフトです。 基本的にDocuWorksは内部にこの機能をもっていますが、その機能を独立したexeとしたものです。 1Pだけですが、クリップボードにも転送できますので、Dcouを画像管理ソフトの代わりに使用している場合も便利です。 本ソフトはImage抽出部分を独立したexeファイルにすることで、xdwファイル名を引数として渡すだけで指定のフォルダに画像ファイルを抽出することが可能です。 例えば次のような使い方が可能です。 @直起★ for DocuWorks*3)から起動させる この方法は内蔵PlugInと殆ど同じ動きをします。 A外部よりXdwファイルをDrag&Dropして画像を抽出する この方法はエクスプローラで使うと便利です。 画像ファイルはjpegやTiffなどで指定フォルダに抽出されます。 *1)DocuWorksは富士Xerox社の文書管理ソフトウェアです。 *2)XdwはDocuWorksのファイル形式です。 *3)直起★ for DocuWorksは弊社のDocuWorks用PlugIn Launchソフトです。 注)本ソフトに動作にはDocuWorks5.0以上が必須となります。 【履歴】 ・Ver0.14:初版登録 |
|||
| ■特徴 ・(Image)XdwからImageを指定フォルダに抽出し出力します。 ・独立ファイルで提供され、コマンドラインでも動作するため、各種の用途に使用できます。 ・Dragに対応しており、1つですがアプリもLaunchできるため、組み合わせて使えます。 また、直起★と組み合わせれば、PlugInのような動作をさせることが可能です。 |
|||
![]() |
■説明 左がスクリーンショットです。 ご覧のようにシンプルそのものです。 最初にXdw2ImageEx.exeを立ち上げて設定を行ってください。 とは言っても、主要なのは出力フォルダを設定するだけです。ファイル名は元ファイルから生成されます。 起動方法ですが、ここでは2例ご紹介します。 【例1】直起★ for DocuWorks 直起★ for DocuWorksを立ち上げ、「引数付で渡すアプリケーション」タブを開き、Xdw2Image.exeをドロップして登録します。 以上で設定完了です。こうしておいて、(Image)Xdwを選び、直起★を起動し、本ソフトを起動すると画像が抽出されます。 【例2】普通に処理する場合 Xdw2Image.exeに(Image)Xdwをドロップします。これだけで、画像が抽出されます。 またDrag対応しましたので、Launchボタンでアプリを起動してD&Dで処理させることも可能です。 指定により結果(最初のページのみ)の画像をクリップボードに転送できます。従ってDocuの画像を他のアプリで活用することも可能です。 ■備考 直起★はDocuWorksのPlugInで提供されているものでPlugIn同様のことができます。 ただ、こうした独立したexe形式のソフトとすることで、バッチ処理的な使い方などができたりエクスプローラで扱うことができるようになります。 |
||
| ■Tips なぜLaunchボタンがあるのか?ですが、クリップボード機能もあり画像処理ソフトを立ち上げると便利です。 また、当方では、これにAIさんのPdMaker for Scanpaperを登録しています。 イメージデータをPDF化した場合で検索したい場合はOCRをかけて「透明テキスト」とするのが一般です。DocuWorksでもVer5では3rdからVer6では内蔵でこの機能が提供されています。しかし、記事にもありますが、問題はなぜかOCRテキストの位置情報が正しく反映されないことです。これは例えばクセロさんのePWareや瞬簡ファイリングでも同様でとても残念なことです。 そこでPdMaker for ScanPaperになるわけです。この中にPdStepというファイル変換用の実行ファイルがありますが、これを利用します。PdStepは逆に(現在)入力はPDFがサポートされておらず、画像だけになています。また、コマンドラインも非公開ですので、この直抜★Imageになるわけです。 つまり、 ・PDFから画像を抜き取り ・PdStepを立ち上げ ・そこのDropして認識しPDFにする とすると多少面倒なのですが、良質な(位置情報を反映したOCRテキスト付の)PDFが得られます。 ■情報(Acrobat7.0Standardを使う) もしAcrobat7.0をもっておられれば、そちらを使う手があります。Acrobat6のOCRは精度的に今ひとつでしたが、Acrobat7.0からはAI社のOCRエンジンを搭載し精度は格段に良くなっています。 またDocuWorks6で「PDF変換」「PDFのサムネイル表示」がありますから、これでPDF変換してAcrobat7.0でOCRすると良質なPDFになります。ただ、この場合はDocuWorksで認識をかけてPDF化するとAcrobatで認識できませんので注意してください。 |
|||
| 直抜Text★ for DocuWorks FreeWare!! |
|||
| Ver0.14 | WinXp・Win2K・WinMe・Win98 | ||
| ■本ソフトは、DocuWorks*1)の文書ファイル(xdw*2)のからテキストを抜き取るソフトです。 本ソフトはテキスト抽出を独立したexeファイルにすることで、xdwファイル名を引数として渡すだけで指定のフォルダにテキストファイルだけを抽出することが可能です。 例えば次のような使い方が可能です。 @直起★ for DocuWorks*3)から起動させる この方法はPlugIn風の動作をします。 A外部よりXdwファイルをDrag&Dropする この方法はエクスプローラで使うと便利です。 *1)DocuWorksは富士Xerox社の文書管理ソフトウェアです。 *2)XdwはDocuWorksのファイル形式です。 *3)直起★ for DocuWorksは弊社のDocuWorks用PlugIn Launchソフトです。 注)本ソフトに動作にはDocuWorks5.0が必須となります。 【履歴】 ・Ver0.14:空白ページに対応しました ・Ver0.13:CR/LFの削除、Page表示を追加 ・Ver0.12:初版登録 |
|||
| ■特徴 ・Xdwからテキストを抽出し、指定フォルダに出力します。 ・独立ファイルで提供され、コマンドラインでも動作するため、各種の用途に使用できます。 また、直起★と組み合わせれば、PlugInのような動作をさせることが可能です。 |
|||
![]() |
■説明 左がスクリーンショットです。 ご覧のようにシンプルそのものです。 最初にXdw2Text.exeを立ち上げて設定を行ってください。 設定は出力フォルダの指定とアプリケーションに送る設定、及び結果をクリップボードに転送するかどうかだけです。 ・出力フォルダは抽出テキストを格納したいフォルダを指定します。 ファイル名は元のXdwから生成されます。 ・アプリケーションに渡すをチェックし、アプリケーションを指定しておくと、生成したテキストを引数にしてアプリケーションを立ち上げることができます。 ・結果をクリップボードに転送するにチェックすると抜き出したテキストをクリップボードに転送することができます。 ・処理後にテキストファイルを消すにチェックすると抜き出したテキストファイルを処理後に削除します。例えば読み上げソフトなどに重宝します。読み上げソフトは別途「簡読★」を提供します。 ・出力には「CRLFを含めない指定」や「Pageを入れる」指定ができます。 起動方法ですが、ここでは2例ご紹介します。 【例1】直起★ for DocuWorks 直起★ for DocuWorksを立ち上げ、「引数付で渡すアプリケーション」タブを開き、Xdw2Text.exeをドロップして登録します。 以上で設定完了です。こうしておいて、Xdwを選び、直起★を起動し、本ソフトを起動すると画像が抽出されます。 【例2】普通に処理する場合 Xdw2Text.exeにXdwをドロップします。これだけで、テキストが抽出されます。 ■備考 クリップボードに転送することで他のアプリケーションでの使用が可能になります。 本プログラムのように独立したexe形式のソフトとすることで、バッチ処理的な使い方などができたりエクスプローラで扱うことができるようになります。 |
||
| 【注意】 このText抽出ですが、 ・OCRを除く普通のXdw:CRLFがページ区切りに入るだけで、ページ内の改行はつきません。 ・OCRが埋め込まれたXdw:行単位で改行がつきます。 という仕様になります。どうのも変な仕様なのですが、本件はDocuWorksのSDKの問題でしょうがありません。(^^! (以下該当部の説明の抜粋です) ■アプリケーションから作成されたページ内のテキストには改行が含まれないが、OCR認識結果の文字列には改行(0A, 0D)やタブ文字が含まれる。 ページの境界やアノテーションの境界で特に切れ目を示す文字を挿入することはせず、単純に文字列を連結して出力する。 SDKがなぜこういう仕様になったのかはわかりませんが、確かに美しくないのでOCRからCR/LFを外すオプションをつけました。本来はすべてCR/LFはつけて出力すべきだと思います。外すのはあとで処理できます。どうにも解せないAPIです。 *SDKの本部分に関してはXeroxさんに改善をお願いしたいです。 |
|||
| 直抜XbdInfo★ for DocuWorks FreeWare!! |
|||
| Ver0.10 | WinXp・Win2K・WinMe・Win98 | ||
| ■ 本ソフトは、DocuWorks*1)の文書ファイル(xbd*2)のバインダ索引・ファイル情報を抽出して表示するソフトです。 DocuWorksでバインダファイルを作った場合に、それとは別に索引ファイルなどを作る場合に便利です。 XbdファイルをDropするだけの簡単操作です。 *1)DocuWorksは富士Xerox社の文書管理ソフトウェアです。 *2)XbdはDocuWorksのファイル形式でバインダ形式です。 注)本ソフトに動作にはDocuWorks5.0が必須となります。 【履歴】 ・Ver0.10:初版登録 |
|||
| ■特徴 ・Xbdからバインダ索引・ファイル情報を抽出し出力します。 ・クリップボードにコピーすることも可能です。 |
|||
![]() |
■説明 左がスクリーンショットです。 ご覧のようにシンプルそのものです。 最初にXbdInfo.exeを立ち上げて設定を行ってください。 設定は「前面」かどうかだけです。Dropで不自由な場合はチェックするといいでしょう。 XbdInfo.exeにXbdをドロップします。これで、右のような情報を表示します。これはバインダファイルだけが対象になります。 複数のファイルでも番号を表示して処理します。 ただの情報表示ですので本体が変更されるわけではありません。 ■備考 クリップボードに転送することで他のアプリケーションでの使用が可能になります。 表示部分で右クリックするとメニューが出て、クリップボードに転送することが可能です。 |
||
| 【備考】 本ソフトはXbdの索引を別に作りたいということで作成しました。 同様の目的のある方には使ってみてください。 |
|||
| ■謝辞 本プログラムは単純にDocuWorksのOCR用APIを起動しているだけです。 このように素晴らしい開発環境を提供いただいた富士Xerox社に感謝いたします。 またMLのDocuWorks−Usersの皆様には、直納☆で沢山の貴重なご意見をいただき、感謝いたしております。 皆様に感謝するとともに、本ソフトをFreeWareとして提供するものです。 是非、直起★ともどもご利用ください。 |
|||
| サポートはメールのみです member@softfarm.net | |||