質問:ハーベストログメールの見方が知りたい

回答:

#メールのサンプルについては、ハーベスト仕様>マイコンテンツ・ユーザ情報のページも参照ください。
#ハーベスト時のエラーチェックについては、ハーベスト仕様のページも参照ください。

ハーベストログメールには、以下の情報が記載されています。

  • ハーベスト開始日時:ハーベストの開始日時です。
  • ハーベスト終了日時:ハーベストの終了日時です。

  • ハーベスト対象データ件数:
     収集対象となったコンテンツの件数です。登録件数・更新件数・削除件数の合計です。
  • 登録件数:
     IRDBに新規として登録されたコンテンツの件数です。
  • 更新件数:
     IRDBに更新として登録されたコンテンツの件数です。
  • 削除件数:
     IRDBから取り下げされたコンテンツの件数です。
     "deleted"として出力されたコンテンツを数えています。
     なお、
     IRDBにハーベストされる前にリポジトリから削除(取り下げ)されたコンテンツや、
     ハーベストの対象ではあるが非公開のコンテンツもここに含まれます。
  • データ取得エラー:
     OAI-PMHやXMLのエラーによりデータ取得に失敗した件数です。
     コンテンツ数ではなく、OAI-PMHのページ数を数えています。

  • レコードエラー件数:
     エラーチェックの結果、IRDBに取り込まれなかったコンテンツの件数です。
  • 項目エラー件数:
     エラーチェックの結果、項目エラーとなった項目の数です(コンテンツ数ではありません)。
     コンテンツ自体は、エラーとなった項目が除かれた状態でIRDBに取り込まれています。
  • ワーニング件数:
     エラーチェックの結果、ワーニングとなった項目の数です(コンテンツ数ではありません)。
     コンテンツや項目はそのままIRDBに取り込まれていますが、エラーメッセージがあります。
  • 項目変換件数:
     エラーチェックの結果、データ内容の正規化が行われた項目の数です(コンテンツ数ではありません)。
     全角→半角など、該当項目のデータ内容が変換された上で、IRDBに取り込まれています。