- Home
- IT, 業界記事(業界事情・製品紹介), 特集・インタビュー
- 〈タイ業界事情〉OCR機能とAI機能付きEDIシステムの詳細について BANGKOK TOKI SYSTEM CO., LTD.
〈タイ業界事情〉OCR機能とAI機能付きEDIシステムの詳細について BANGKOK TOKI SYSTEM CO., LTD.
- 2021/11/19
- IT, 業界記事(業界事情・製品紹介), 特集・インタビュー
難波 孝次 氏 Managing Director
OCR機能とAI機能付きEDIシステムの詳細について
今回は先ず、以前に話をさせていただきましたOCR機能について再度の説明といいますか弊社のホームページ内に同機能を組み込んでみましたので、そちらの紹介からおこなわせていただければと考えております。といいますのが同内容について何度かお問い合わせをいただきましたこともあり、それであればということで、どなたにでも試していただくことが出来るようにしました。
アドレスは「www.bkktoki.com/ocr/」となっておりまして、このアドレスにWEBブラウザーにて接続していただきますとOCR画面が立ち上がる仕組みでございます。一般のPCであればこの画面の中の「Browse」ボタンを押していただきますとファイル選択の為のエクスプローラーが表示されますので、読み込みをおこなうJPEG等の画像ファイルを選択していただきますと、読み込んだ画像ファイルと共にその画像に表示されている文字情報がテキストデータとして画面に表示されます。また背面カメラを装備しておりますスマートフォンやタブレットPCですと「CAPTURE」ボタンでカメラが起動されますので、紙の資料でも画面上に表示されている内容でも良いのですが、文字が含まれている部分をカメラに写してもらえば、その内容がそのままOCR画面に表示されると共に文字情報をテキストデータとして取り出すことが可能になっております。(スマートフォンですとWEBブラウザーはサファリよりクロームの方が読み取り精度が高いようです)ただ、トライアル機能ということで対象範囲や読み取り精度については少し絞っておりますので、あまり精緻な情報は取りこぼしたり誤変換といった結果になることもあるかとは思いますが、大体こういったイメージのものであるということをご確認いただければと考えております。(操作方法については、資料画像をご参照いただけますでしょうか)
続きまして、前回の宿題となっておりましたAI機能を盛り込んだEDIシステムについての詳細説明となります。前回はアップロードされるファイルの中に含まれてる何十種類もある項目の中から、AI機能を使って必要項目を探し当てるという何ともアバウトな説明をさせていただきましたが、今回は具体的な手法についての話をさせていただきたく考えております。
先ず発注番号の特定方法についてですが、これは既に同じ取引先さんの受注データがシステムの中に入力されていれば比較的簡単な作業となります。具体的な例を挙げますと、以前に入力された発注番号が「PO2100050」だったとしますと、システムとしては各項目群の中から同じようなコード体系を持つ項目を探していき「PO2100105」のような値が見つかれば、同項目が発注番号であると特定いたします。ただ、このように簡単に判断できるようなケースばかりであれば良いのですが、中には最初の管理コードが発注タイプにより様々に変わるケースもあるでしょうし、そもそも初めてデータを取りこむケースでは、この手法で特定をおこなうことは無理ですので、別の検索手法を模索する必要があります。そこで文字数に注目してみますと、発注番号であれば何れのシステムをご使用されているとしても通常10文字から20文字くらいに収まっており、また全ての番号はシステムで管理されている都合上同じ文字数になっているかと思います。あと特徴といたしましては、番号体系に年月日の数字が入っていることがよくあり、具体的には年月日+連番とか年月+連番といった作りになっているケースが多く、そこで検索手法として今年であれば2021年の「21」という文字が入っている項目があるかどうかを探して、ただそれが発注日付や指定納期である可能性もありますから、日付形式の項目は除外して、それから連番を使われるケースを想定して「00」という文字が含まれていればその確率は更に高くなるといった形で検索をおこなっていきます。
次に発注日付や指定納期の特定作業ですが、こちらは発注番号に比べると比較的簡単でございまして、先ず日付形式になっているもの、具体的には「10/10/2021」とか「2021-10-10」という値が入っている項目を探し出しすことで特定することが出来ます。ただ日付の場合1点厄介なのが日本式のように年月日と並んでいれば問題無いのですが、タイで使われる日付形式には北米式の月日年と英国式の日月年の2種類が入り混じっておりまして、これが例えば「15/10/2021」や「10/15/2021」のように日が13日以上であれば識別は出来るのですが「10/11/2021」だった場合、果たして10月11日なのか11月10日なのかを判別することは不可能ですので、この場合全てのデータを読み込み13日以上の日付を探して、どちらの形式かを判別する作業が必要になります。あとレアケースとしまして、日付が「20211010」といった形の数字の羅列で収められていることも考慮いたしまして、この場合は文字数8桁の場合は頭4桁が年数、文字数6桁であれば頭2桁が年数といった形で判別をおこなっていきます。このような手法で日付項目を取得した後に、日付の新しい方を指定納期、古い方を発注日付といった形で割り付けていきます。
続いて明細部に移りまして、先ずは重要な項目となる品目コードについてなのですが、実は品目コードが格納されている項目を特定することはそれほど難しくありません。と言いますのは通常品目コードはシステム内のマスターとして登録されておりまして、仮に社内の管理コードと取引先さんの管理コードが異なっている場合でも、インボイス発行用に客先品目コードを登録されているケースがほとんどだと思います。この為、客先品目マスターに登録されている値が何れの項目に格納されているのかを探すだけで、特定することが可能となります。
次に発注数量、単価及び金額について考えてみますと、こちらは今までのように単純にはいきません。検索手法といたしましては、項目群の中より数値項目を全部抜き出してその中より何れの項目が発注数量で何れの項目が単価なのかを判別する必要があるのですが、数値項目ということですと例えば明細番号ですとか、単位コードを始めとする様々なマスターコードですとか、その他にも色々な管理項目が納められておりまして、中には十数種類もの数値項目が存在するケースもあるかと思います。仮に10種の数値項目があった場合に、それらの中からどのように発注数量を特定するのかというのは何とも雲を掴むような話なのですが、そこで発想を変えてみまして数量と単価が既に特定できているとすれば、その状態で金額を特定することは可能でしょうか。その状況であれば、単純に数量と単価を掛けた値に合致する項目があれば、端数処理の問題はあるにせよ、容易に金額項目を特定することは出来るでしょう。それでは逆に金額項目のみが特定されている場合はどうでしょうか。その場合は少々厄介なのですが、二つの項目を掛け合わせた値が金額値になる組み合わせを探せばよい訳で、例えば金額値が「1,000」だった場合「10」と「100」という2つの値が見つかれば、そのどちらかが数量でどちらかが単価である可能性が高いと言えますので、2項目の組み合わせをしらみつぶしに探していけば、複数のパターンが存在することもあるとはいえ、かなり高い確率で解答に辿り着くことが可能となります。
では同じような要領で、数量、単価及び金額の3項目が全て不明の場合でも特定することは可能かどうかを考えてみます。上記のように「A×B=1,000」の場合、数値項目の中から2つの項目の組み合わせでAとBとを見つけ出すことが可能なのですから、同じように「A×B=C」の関係が成り立つ3つの項目を見つけ出すことも、組み合わせの数は増えるのではありますが理論上は可能であると言えるでしょう。ただ、この組み合わせ作業を人の手でおこなうとすれば頭が痛くなりそうですが、そこはそういう単純作業が得意なコンピューターに任せることにより、それほど時間を要することなく答えが導かれます。そこで金額項目についてはすぐに特定出来るのですが、残りの数量と単価については、これは果たしてAが数量でBが単価なのか若しくはその逆なのかを特定することは少々困難となります。単価については、販売単価マスターとして登録されたデータがあればそこから判別することも可能ですが、そうでない場合は単純に最初に見つかったAを数量に次のBが単価にといった形に関連付けておいて、もしそれが逆であった場合は、手動で調整を行うといった形が一般的なものになるかと思います。
といったような感じで、ここまで説明させていただいたような内容はあくまでも1例でございまして、他の項目についても同じような形で様々な手法を駆使して各種項目を特定していく流れになりまして、また特定手法には学習機能を持たせておりますので、使えば使うほどより精度が上がっていくという形となっております。そこで現在取引先さんのEDIデータの取り扱いに困られている方や、EDIデータを受信はしているもののアップロード機能の作りこみが大変で、結局手入力をされているといった方がいらっしゃいましたら、現在お使いのシステムに本機能を組み入れることも可能でございますので、お気軽にお問い合わせをいただけますでしょうか。
BANGKOK TOKI SYSTEM CO., LTD.
住所:333 Lao Peng Nguan Tower 1, 17th Floor, Unit B1, SoiChaypuang,
Viphavadi-Rangsit Road, Chomphol, Chatuchak, Bangkok 10900
電話:0-2618-8310-1 ファクス:0-2618-8312 Eメール:toki@ksc.th.com
ウェブサイト:www.bkktoki.com