ハンディターミナル BT

99.8%の認識率と、残り0.2%の壁。
人間の感覚に近づく、6,000万パターンの道のり。

自動認識事業部
能⾒ ⼤河

近年、スマートフォン向けの名刺リーダーといったアプリの普及により、急激に身近な存在となった「OCR(Optical Character Recognition)」。読み取った文字を認識しデータ化するこの画期的な機能は、あふれる情報を整理しながら効率良く活用していけるというビジネスにおける救世主のような存在だ。しかし、製造や流通の現場で「本当に使える」レベルの技術はその難解さゆえ実用化されておらず、真に求められている現場で活用することのできるOCRリーダーはどこにもなかったのだ。そんな困難を極めることが容易に想像されるプロジェクトのアルゴリズム開発を任されたのは、入社2年目の能見であった。

既存の方法論では届かない領域。ならば、創り出すしかない。

既存の方法論では届かない領域。ならば、創り出すしかない

製造や流通の現場で管理されるべき文字情報は、実に様々。フォントや印字方式、文字の大きさのみならず、照明の強さ・明るさなどの環境によっても読み取り精度は左右される。また、WとV Vや、O(オー)と0(ゼロ)などのよく似た文字を識別する力だけではなく、どんな角度でかざしても安定して読み取れる安定性も必要だ。考えねばならないことは、多岐にわたる。既存のOCRと同じやり方ではだめだということはすぐにわかった。やるしかない、能見はそう闘志を燃やし、全く新しい認識アルゴリズムの開発へと着手したのだった。

「人に読めるものは、OCRでも読めなければならない」

「人に読めるものは、OCRでも読めなければならない」

様々なアルゴリズムを試みた結果、ついにテスト評価で99.8%の認識率を達成した。さらに速度と精度を両立できる見通しも立ち、自信をもってユーザーの現場にプロトタイプを持って行った。だが、結果はまさかの惨敗。ユーザーの現場では、照明も暗く、読みたい文字も想定以上に難解であり、読み取り性能の低さや読み違いが多発した。「こんな環境でも自分にはこの文字が認識できる。人が読めるものは、OCRでも認識できるべきだ」というユーザーからの無茶な要求。しかし、「人が読める」ということは何かの情報を使っており、何かルールがあるのではないか?それを突き詰めれば、必ず解決できるはずだ!いかに人間の頭脳に近づけていくか。それが答えだ。解は必ずあると、思考をあらゆる方向へ広げ悩み抜くことで、能見は「まだ無いもの」へ一歩ずつ近づいていった。

残り0.2%への泥臭い挑戦の結末は、"当たり前"だった。

残り0.2%への泥臭い挑戦の結末は、"当たり前"だった

読み取り性能の改善に苦闘する日々は、来る日も来る日も続いた。しかし一人で考えるには限界があり、他のプロジェクトメンバーからもたくさんの意見やアイディアをもらった。また、他のメンバーと手分けして、様々なお客様の元へ出向き、意見を聞いた。その中で辿り着いた答えが、「誤読のフォローを人に委ねる」という発想を転換した解だった。物理的に発生するケースとして、読みたい文字列の一部が視野外に出ることで桁落ちする場合や、光沢による文字の白飛び、薄い印字などを誤読パターンにまとめ、アラートを出す機能へと組み込んでいった。読み取り性能を極限まで高めた上で、それでも届かないところを人の判断に委ねる。そのためのアラート機能を充実させ、文字認識・データ管理を徹底的にサポートできるレベルまで辿りつくことができた。

こうした改善の結果、これまでOCRでの運用を諦めていたユーザーには「こんなに読めるのか!」と初のOCR導入へと踏み切っていただくことができた。能見一人だけでなく、プロジェクトチーム一体となって泥臭い挑戦に立ち向かい、勝利した瞬間だった。開発者としてこれほど嬉しいことはない。新たなスタンダードを生み出せた実感が、能見の胸中にこみ上げた。

入社2年目での奮闘。キーエンスの開発者として、最も大切なことを知る。

入社2年目での奮闘。
キーエンスの開発者として、最も大切なことを知る

能見がこのプロジェクトを担当したのは、入社2年目になってすぐのこと。付加価値の高いアルゴリズムを開発するには、筋の良い技術を選ぶセンスと、現場・現物に即した考え方の両輪が必要となる。また、難解なことにも、若手でも挑戦を楽しんでいける環境があるからこそ、世の中で誰よりも先に次のニーズに応える開発ができ、世の中のありようを変える製品を生み出すことができるのだ。「ソフトウェア開発者として、自ら開発したものがそのまま付加価値になるということは、これ以上ない喜び。」そう語る能見の視線は、もう次の挑戦へと向かっている。

ANOTHER PROJECT

その他の開発プロジェクト