エラーチェック解説

JPCOARスキーマでハーベストした際のエラーチェック解説ページです。

IRDBでは高品質なメタデータを収集、提供するために各種エラーチェック・正規化処理を実装しています。

エラーチェック・正規化処理の詳細は マッピング・エラーチェック・正規化仕様_JPCOAR_v1.0.1 を参照してください。

 

レコードエラー

 ハーベスト時のエラーチェックで以下に該当する場合はレコードエラーとなり、そのアイテムはIRDBに登録されません。

 レコードエラーの内容は、ハーベストログメールでご確認いただけます。

 

必須要素がない

1 タイトル (dc:title)

 要素・値がない場合以外に、以下のケースもエラーとなります。

  • 言語属性 (@xml:lang) が重複している。(日本語タイトルが2つある等)

 同じ言語属性を持つタイトルを複数登録することはできません。
 また、言語属性を持たないタイトルを複数登録することもできません。
 タイトルを複数登録する場合は、必ず重複のない言語属性を設定してください。

  • 言語属性 (@xml:lang) に"ja-Kana"が指定されているとき、言語属性"ja"のデータがない

 タイトルにカナを設定する場合は、併せて日本語タイトルも設定してください。

14 資源タイプ (dc:type)

 要素・値がない場合以外に、記入された値が語彙に存在しない場合もエラーとなります。
 資源タイプ語彙別表を参照のうえ、定義済みの語彙を使用してください。


発行日の記入がない

12 日付 (datacite:date@dateType="Issued")

 発行日の記入は必須です。

 

資源タイプが学位論文のとき、作成者の記入がない

 14 資源タイプ (dc:type) が下記のいずれかの場合、3 作成者 (jpcoar:creator) は必須になります。

  • 学位論文 (thesis)
  • 学士論文 (bachelor thesis)
  • 修士論文 (master thesis)
  • 博士論文 (doctoral thesis)

 

17 識別子と18 ID登録の内容が一致しない

 JaLC DOIを登録する場合は、DOI値を18 ID登録 (jpcoar:identifierRegistration) に入力すると同時に、17 識別子 (jpcoar:identifier) にidentifierType="DOI"として入力する必要があります。

 jpcoar:identifierRegistration@identifierType="PMID" の場合は、このチェックは入りません。(注:identifierType="PMID" は現在不使用です。)


JaLC DOIのメタデータ条件を満たさない

 18 ID登録 (jpcoar:identifierRegistration) に値がある場合、JaLCへ提出するためのメタデータフォーマットチェックを実行します。

 

国立国会図書館博士論文自動収集の条件を満たさない

 14 資源タイプ (dc:type) が"doctoral thesis" 且つ 32 学位授与年月日 (dcndl:dateGranted) が2013年4月1日以降の場合は、国立国会図書館へ提出するためのメタデータフォーマットチェックを実行します。

 


項目エラー

 項目エラーは、エラー項目を除外してIRDBに登録します。

 項目エラーの内容は、マイコンテンツでご確認ください。

 JPCOARスキーマは多数の要素が定義されているため、いくつかの要素に共通する代表的なチェック内容を以下に記載します。

 


統制語彙のチェック

 統制語彙が設定されている項目は、入力された語彙が存在するのかチェックを行います。

  • チェック対象要素(一例)
    • 3.1 作成者識別子 (jpcoar:creator/jpcoar:nameIdentifier/nameIdentifierScheme)
    • 9 主題 (jpcoar:subject/subjectScheme)
    • 17 識別子 (jpcoar:identifier/identifierType) ほか

 また、語彙毎に入力フォーマットが決まっている場合には、フォーマット通りに入力されているかのチェックも行います。

 個別のチェック内容については、マッピング・エラーチェック・正規化仕様_JPCOAR_v1.0.1 語彙別表を参照してください。

 

言語属性のチェック

 JPCOARスキーマでは、言語属性をISO 639-1の2桁の言語コードで設定します。

 設定された言語コードに対し以下のチェックを行います。

  • 語彙に存在するか
  • 日本語のヨミ"ja-Kana"が設定されているとき、ヨミとは別に日本語"ja"が記入されているか

 また、繰り返し可能な項目でも繰り返し回数が各言語ごとに1つと決まっている要素がいくつかあります。
 これらの要素は言語属性をチェックして、2つ以上の同名要素に重複した言語が設定されていないかをチェックします。

  • チェック対象要素(一例)
    • 3.2 作成者姓名 (jpcoar:creator/jpcoar:creatorName)
    • 24 収録物名 (jpcoar:sourceTitle)
    • 33.2 学位授与機関名 (jpcoar:degreeGrantor/jpcoar:degreeGrantorName) ほか

 

日付のチェック

 日付形式及び月と日の組み合わせが実在するものであるかのチェックを行います。
 項目毎に定められた年の範囲を超えているもの(極端な未来など)についてはワーニングが出ますが、データはそのまま登録されます。ワーニングメッセージを確認のうえ、誤りがあれば修正してください。

  • チェック対象要素
    • 12 日付 (datacite:date)
    • 32 学位授与年月日 (dcndl:dateGranted)
    • 35.4 ファイル情報-日付 (jpcoar:file/datacite:date)


URL形式のチェック

 入力形式がURL形式である項目は、URL形式チェックを行います。

  • チェック対象要素(一例)
    • 17 識別子 (jpcoar:identifier)
    • 35 ファイル情報-本文URL (jpcoar:file/jpcoar:URI) ほか