GOLDコンバーターについて
Convert.Guru は、25年以上にわたり維持・更新されてきた、世界最大級かつ信頼性の高いファイル形式データベースの一つを基盤としています。 当社の形式判定機能は、GOLD を高い精度で識別します。ファイル名が誤っている場合や破損している場合でも対応し、一般的な形式へ変換できます。GOLD コンバーターは登録やインストール不要で、ブラウザ上でそのまま利用できます。 アップロードされたファイルは、変換後に自動的に削除されます。
正解データファイル (GOLD) からテキストを抽出
.GOLDファイル拡張子は、主に自然言語処理(NLP)やSemEval共有タスクなどの機械学習評価におけるGold Standard Annotation(ゴールドスタンダードアノテーション)データセットに使用されます。これらのファイルには、AIモデルのベンチマークに使用される「グラウンドトゥルース(正解)」ラベル、テキストの要約、または感情テキストデータが含まれています。2つ目の非常に特殊な用途として、計算化学ソフトウェアであるCCDC GOLD(Genetic Optimization for Ligand Docking)の分子ドッキンググリッドファイルとして使用されます。また、Wekaの機械学習パイプラインやGoldfire Summary Assistantに関連付けられることもあります。
「ゴールドスタンダード」データセットは、さまざまな学術グループによって独自に作成されるため、.GOLDファイルに普遍的な構造はありません。通常は、カスタムXML、TSV(タブ区切り値)、または独自のタグベースのレイアウトとしてフォーマットされたプレーンテキストファイルです。主な欠点は、この深刻な標準化の欠如です。2018年のSemEvalタスクのデータセットは、2023年のものとはまったく異なる内部スキーマを持つため、研究者はファイルを使いやすい形式に解析するためだけにカスタムのPythonスクリプトを作成する必要があります。
Pandas、Microsoft Excel、Rなどの最新ツールでデータを分析するには、生の.GOLDファイルを標準の.CSV、.JSON、または.TXT形式に変換する必要があります。ファイルがCCDC分子ドッキングファイルである場合、CCDCソフトウェアエコシステム以外では事実上役に立たない、クローズドな独自の構造を使用しています。標準的なオンラインコンバーターは、内部の学術的スキーマや独自のバイナリ構造を認識しないため、.GOLDファイルの処理に日常的に失敗します。
このファイル形式は開いたり変換したりするのが難しいため、多くの場合、元の学術スクリプトまたは独自のソフトウェアのみがデータを適切に読み取ったりエクスポートしたりできます。ただし、convert.guruはファイル形式を識別し、ファイルを検査して、テキストや内部コンテンツを表示することができます。ファイルをドラッグ&ドロップするだけで、形式を識別し、表示し、可能な場合は変換できます。当社の分析でサポートされている基盤となるテキスト形式や埋め込まれたテキスト形式が検出された場合、一般的なデータ形式への表示や変換が可能な場合があります。
Convert.Guru はGOLDファイルを分析し、正確な形式を検出して、中のテキストを読めるようにします。
ほかのユーザーは TES, ARFF, NAMES, RM ファイルも変換しました。
GOLD ファイルを RM, CSV, JSON, XML, YAML, YML, TOML, INI, CFG, CONF, DAT または DB に変換したい場合は、Weka または「グラウンドトゥルースデータの保存」カテゴリの同様のソフトウェアを使用できます。[ファイル] メニューで 名前を付けて保存… または エクスポート… を探してください。
DBF, XML, SQLITE, XLSX, SQL, TSV, ACCDB, YAML, MDB, CSV, ODS または JSON ファイルを GOLD に変換するには、Weka または「グラウンドトゥルースデータの保存」カテゴリの他の同等のツールを試してください。
Convert.Guru は、25年以上にわたり維持・更新されてきた、世界最大級かつ信頼性の高いファイル形式データベースの一つを基盤としています。 当社の形式判定機能は、GOLD を高い精度で識別します。ファイル名が誤っている場合や破損している場合でも対応し、一般的な形式へ変換できます。GOLD コンバーターは登録やインストール不要で、ブラウザ上でそのまま利用できます。 アップロードされたファイルは、変換後に自動的に削除されます。