エラーチェック解説

junii2でハーベストした際のエラーチェック解説ページです。

IRDBでは高品質なメタデータを収集、提供するために各種エラーチェック・正規化処理を実装し、junii2形式のメタデータをJPCOARスキーマ形式に変換して保存します。

エラーチェック・正規化処理の詳細は マッピング・エラーチェック・正規化仕様_junii2 を参照してください。

 

レコードエラー

 ハーベスト時のエラーチェックで以下に該当する場合はレコードエラーとなり、そのアイテムはIRDBに登録されません。

  • 必須の要素 (element) がない。(タイトル、NII資源タイプ、資源識別子URI)
  • 語彙に存在しないNII資源タイプが入力されている。
  • JaLC DOIのメタデータ条件を満たさない。(selfDOIに値があるときのみ)
  • 国立国会図書館博士論文自動収集の条件を満たさない。(著者版フラグがETDのときのみ)

 レコードエラーの内容は、ハーベストログメールでご確認いただけます。

 


項目エラー

IRDBでは、junii2でハーベストしたデータをJPCOARスキーマ形式に変換して保存しています。
そのためハーベスト時には、JPCOARスキーマに準拠するように各項目のフォーマットチェックを行います。

項目エラーは、エラー項目を除外してIRDBに登録します。
項目エラーの内容は、マイコンテンツでご確認ください。

 

主題(※)

※日本十進分類法、国立国会図書館分類表、デューイ十進分類法、米国議会図書館分類表

 種類別にフォーマットチェックを行います。
 例えば、日本十進分類法は数値とピリオド以外の文字が含まれている場合に項目エラーとなります。

 種類別のチェック内容はマッピング・エラーチェック・正規化仕様_junii2を参照してください。

エラー例

  • 1項目に複数の主題が入力されている。(511.3 / 511.27 / 455.1)
  • 値以外のラベル("NDC9"など)が付いている。(NDC9:017.7)
    • →1項目に1つずつ、主題本体だけを入力してください。

 なお、著者キーワード (subject) には入力内容の制限はありませんが、1項目につき254文字を超えた場合は超えた部分をカットして登録します。

 

言語

#各要素の言語属性ではありません。

 ISO-639-2からISO-639-3への変換を行います。
 junii2ガイドラインでは「許容」とされているISO-639-1は扱いません。
 変換元・変換先に該当するコードが存在しない場合に項目エラーになります。

エラー例

  • ISO-639-1等、2桁コードを指定している。
  • ISO-639-2で複数コードがあるものについて、ISO-639-3と共通しない方のコードを指定している。(chi / ger / ..)
  • ISO-639-2にはコードがあるが、ISO-639-3にはコードがない言語を指定している。(ira / ..)

 

日付、刊行年月、学位授与年月日

 日付形式及び月と日の組み合わせが実在するものであるかのチェックを行います。

エラー例

  • YYYY-MM-DD, YYYY-MM, YYYY形式以外の記述(2000-APR)
  • 複数の日付または範囲記入(1964-1965)
  • 和暦の年のみ、または年月のみ(昭15)
  • 存在しない日にち(2013-12-32)

 項目毎に定められた年の範囲を超えているもの(極端な未来など)についてはワーニングが出ますが、データはそのまま登録されます。ワーニングメッセージを確認のうえ、誤りがあれば修正してください。

 

本文フルテキストへのリンク、版に関する情報(※)

※異版である、異版あり、置換される、置換する、要件とされる、要件とする、部分である、部分を持つ、参照される、参照する、別フォーマットである、別フォーマットあり

 URL形式チェックを行います。URL形式以外の記述は登録されません。

 

識別子(※)

※ISBN、ISSN、書誌レコードID(総合目録DB)、PubMed番号、DOI、NII論文ID、医中誌ID

識別子の種類ごとに桁数、文字種、チェックデジット、記述形式のチェックを行います。

エラー例

  • 1項目に複数の識別子が入力されている。(87654321@@@12345678)
  • 値以外のラベル("print"、"NCID"など)が付いている。(0000-0000(PRINT))
  • URI型式の入力(http://ci.nii.ac.jp/ncid/AA12345678)
    • →1項目に1つずつ、識別子本体だけを入力してください。

 ISSN、ISBNのハイフンの有無はどちらでも問題ありません。

 

著者版フラグ、および各項目の言語属性

 語彙のチェックを行います。
 定義された語彙以外は項目エラーとなり、登録されません。
 言語属性がエラーとなった場合は、その言語属性は登録されませんが、要素に入力された値は登録されます。

 

各項目の文字数チェック

 以下の項目は制限文字数を超えた場合は項目エラーとなり、その値は登録されません。

  • 巻、号:32文字
  • 開始ページ、終了ページ:100文字

 その他の項目(以下)は、項目毎に定められた文字数を超えた場合は、超えた部分をカットして登録します。その場合、項目変換としてハーベストログに表示します。

  • 作成者:512文字
  • 出版者:512文字
  • 寄与者:512文字
  • 主題:254文字
  • BSH:128文字
  • NDLSH:128文字
  • MeSH:128文字
  • LCSH:128文字

#複数の値がある場合、JPCOARスキーマへの変換を考慮し、1つのフィールドに1つの値を記述すること。
 (カンマ区切り等で1つのフィールドに複数の値を記述しない。繰り返し可能な項目についてはフィールドを繰り返す。)