質問:ハーベストログメールの見方が知りたい
回答:#メールのサンプルについては、ハーベスト仕様>マイコンテンツ・ユーザ情報のページも参照ください。
#ハーベスト時のエラーチェックについては、ハーベスト仕様のページも参照ください。
ハーベストログメールには、以下の情報が記載されています。
- ハーベスト開始日時:ハーベストの開始日時です。
- ハーベスト終了日時:ハーベストの終了日時です。
- ハーベスト対象データ件数:
収集対象となったコンテンツの件数です。登録件数・更新件数・削除件数の合計です。 - 登録件数:
IRDBに新規として登録されたコンテンツの件数です。 - 更新件数:
IRDBに更新として登録されたコンテンツの件数です。 - 削除件数:
IRDBから取り下げされたコンテンツの件数です。
"deleted"として出力されたコンテンツを数えています。
なお、
IRDBにハーベストされる前にリポジトリから削除(取り下げ)されたコンテンツや、
ハーベストの対象ではあるが非公開のコンテンツもここに含まれます。 - データ取得エラー:
OAI-PMHやXMLのエラーによりデータ取得に失敗した件数です。
コンテンツ数ではなく、OAI-PMHのページ数を数えています。 - レコードエラー件数:
エラーチェックの結果、IRDBに取り込まれなかったコンテンツの件数です。 - 項目エラー件数:
エラーチェックの結果、項目エラーとなった項目の数です(コンテンツ数ではありません)。
コンテンツ自体は、エラーとなった項目が除かれた状態でIRDBに取り込まれています。 - ワーニング件数:
エラーチェックの結果、ワーニングとなった項目の数です(コンテンツ数ではありません)。
コンテンツや項目はそのままIRDBに取り込まれていますが、エラーメッセージがあります。 - 項目変換件数:
エラーチェックの結果、データ内容の正規化が行われた項目の数です(コンテンツ数ではありません)。
全角→半角など、該当項目のデータ内容が変換された上で、IRDBに取り込まれています。