このたび、Wovn Technologies株式会社(本社:東京都港区、代表取締役社長:林 鷹治、以下 WOVN)は、WOVN.io 新機能「ワイルドカード翻訳」の提供を開始いたします。これにより翻訳の自動運用をさらに加速させ、同時に効率よい翻訳管理を可能にします。

■「ワイルドカード翻訳」の概要
「ワイルドカード翻訳」を利用することで、数字を含む文字列の翻訳自動運用をよりスムーズに行えるようになります。機械翻訳の性質上、金額表記やサイズ違いの商品など数字以外は同一の文字列であっても、それぞれひとかたまりの文字列として翻訳を行います。そのため、数字部分が不要に翻訳されたり、表記に統一性がないなどの問題が発生したりしていました。こうした課題に対応するため、エンジニアによって HTML 修正を行い、数字を個別に翻訳対象から除外する、もしくは数字を含む文字列を人力で翻訳する必要がありました。

「ワイルドカード翻訳」では、これらの事象を解決できるようになります。


■「ワイルドカード翻訳」が機械翻訳をより効率的に使える仕組みについて
従来 Web サイトにおいては HTML タグで囲まれた文字が、ひとかたまりの文字列として認識されます。そのひとかたまりの文字列に対して、品番や長さ・重さが異なるような数字を含む文字列があった場合は、機械翻訳エンジンにとって、別の文字列、という認識が働きます。

それに対して、数字部分のみを可変(ワイルドカード)として捉えることで、不要な機械翻訳作業を防ぐことが可能になります。さらに、数字を含む文字列のパターンを一度 WOVN.io に登録すれば、再度同様の文字列パターンの自動翻訳時にも、数字部分を原文に合わせつつ、統一された翻訳対応がされるようになります。

■主な活用シーン
EC サイト・商品ブランドサイトなどで品名に可変な数字が含まれるケース
同じ商品名でありながらも“電源コード 5m”、“電源コード 10m”、“電源コード 15m”のように、サイズなどの数字を含む表記のみが異なる類似商品が多数存在する EC サイトにおいては、数字を含む文字列をスペルアウトした、“five m”、“ten m”、“25 m”といった不統一な翻訳結果が表示されることがありました。また、それぞれを“異なる文字列”として認識するため、統一感を出すことができませんでした。

このように、色違いによる品番(数字)が商品名に入っている場合、長さ・重さの違い自体が商品名に含まれているようなケースにおいて、数字を除いた文字列をパターン登録することで、商品番号などの数字部分が変数として認識されるようになり、文字列自体は同一パターンとして翻訳が適用されます。


ニュースサイトやコーポレートサイト
曜日や日付を伴う記事コンテンツなどで、更新頻度が高いニュースサイト・コーポレートサイトなどでは、曜日をパターン登録することで日付け(数字の部分)を可変と認識するようになります。

それによって2023/02/28(火)を、“2023/Feb/28 (fire)”や“2023/02/twenty eight(Tue)”といった揺れを削減し、統一的な翻訳運用をすることが可能になります。


■「ワイルドカード翻訳」機能の主なメリット

  1. 翻訳にかかる人力工数の大幅削減
  2. 効率よい翻訳管理を実現
  3. 翻訳の自動運用を促進しながら、安定した翻訳品質を提供

今後はさらに機能をブラッシュアップし、WOVN.io が Web サイトの情報をクローリングすることで、「ワイルドカード翻訳」の対象となりうるパターンをもつ箇所をあらかじめリストアップし、登録を推奨することで、さらなるユーザーの利便性向上を図ってまいります。


■WOVN.io
URL:https://mx.wovn.io/

合わせて読みたい

コマースピックLINE公式アカウント

コマースピックメルマガ