Начало | UNIMARC Manual: bibliographic format |
следва: Основна информация за маркера |
UNIMARC е специфично приложение на международния стандарт ISO 2709, който определя структурата на записи, съдържащи библиографски данни. Според стандарта всеки библиографски запис, който е предназначен за обмен, трябва да се състои от:
Маркер на записа | Директория | Полета за данни | R/T |
R/T = знак за край на записа |
Според ISO 2709 данните в полетата по желание могат да бъдат предхождани от индикатори и да бъдат подразделяни на подполета. Като приложение на стандарта UNIMARC използва следните специфични възможности, предоставени от него.
В ISO 2709 всеки запис започва с маркер от 24 символа. Той съдържа данни за структурата на записа, които са определени със стандарта ISO 2709, както и няколко елементи от данни, които са определени за това приложение на същия стандарт. Тези определени за приложението елементи от данни се отнасят до вида на записа, до неговото библиографско ниво и до мястото му в йерархията от нива, до степента на пълнота на записа и до използването на ISBD или на правила, изработени на основата на ISBD при създаването на записа. Елементите от данни в маркера на записа са необходими най-вече за автоматизираната му обработка и само индиректно са предназначени за използване при идентифицирането на самата библиографска единица.
Директорията следва маркера на записа. Всеки отделен компонент на директорията се състои от три части: тризначен цифров етикет, четиризначно число, означаващо дължината на полето за данни и петзначно число, означаващо позицията на началния символ. В директорията не е позволено използването на никакви други знаци. Структурата на директорията е следната:
1-ви компонент на директорията |
2-ри компонент други на директорията компоненти |
Етикет | Дължина на поле | Позиция на началния символ |
....................... | F/T |
F/T = знак за край на полето |
Вторият сегмент от компонента на директорията посочва броя на символите в това поле. Това включва всички символи: индикатори, идентификатори за подполета, текстови или кодирани данни и маркера за край на полето. Дължината на полето е последвана от позицията на началния символ на полето по отношение на позицията на първия символ в променливата част на полето на записа. Първият символ на първото променливо поле има символна позиция 0. Позиция 0 в рамките на целия запис се дава в символните позиции 12-16 на маркера на записа.
Етикетът е с дължина 3 символа, "дължина на данните" запълва 4 символа и "позиция на началния знак" - 5 символа. След всичките 12-символни компоненти на директорията, които се отнасят до всяко поле от данни в записа, директорията завършва с маркер за край на полето IS2 от ISO 646 (1/14 от 7-битовата кодова таблица). За пример, който илюстрира директория и нейното положение по отношение на полетата от данни Вж цялостните примери в Приложение L. Компонентите на директорията трябва да бъдат подредени по първата цифра на етикета. Препоръчва се, когато е възможно, подреждането да се извършва по целия етикет. Не се налага самите полета да се подреждат в определен ред, тъй като тяхното положение се определя изцяло от директорията.
Полетата от данни с променлива дължина следват директорията за разлика от данните, предназначени за автоматизирана обработка, които съдържат библиографски данни.
Схема на поле за (контролни) данни (00-):
данни | F/T |
Схема на поле за данни (01- до 999)
индикатори идентификатор за подполе други подполета
инд.1 | инд.2 | $a и т.н. | данни | данни | ........................ | F/T |
Етикетите се изписват само в директорията и не се включват в полетата от данни, като изключение се прави само за етикетите на въведените полета (вж блок 4). Полета със стойност на етикета 00- / напр. 001/ се състоят само от данни и символ за край на полето. Другите полета от данни се състоят от два индикатора, последвани от различен брой подполета. Всяко подполе започва с идентификатор за подполето, който се състои от ограничител за него ISl (1/15 от ISO 646) и код за подполето (един буквен или цифров символ), който да го идентифицира. Идентификаторите за подполета са последвани от кодирани или текстови данни с различна дължина, освен ако в описанието на полето не е заложено друго. Последното подполе в полето завършва със символ за край IS2 (1/14 от ISO 646). Последният символ от данните в записа обикновено е последван от символ за край на полето IS2, който в този случай е последван от символ за край на записа IS3 (1/13 от ISO 646).
Следва списък на полетата, които трябва да присъстват в запис, създаден във формат UNIMARC
001* идентификатор на записа
100* общи данни, свързани с обработката
101 език на документа (когато е приложимо)
120 поле за кодирани данни: картографски материали: общо (само за картографски издания)
123 поле за кодирани данни: картографски материали: мащаб и координати (само за картографски издания)
200* заглавие и сведение за авторска отговорност ($a основното заглавие е единственото задължително подполе)
206 специфична област на вида на материала: картографски материали: математически данни (само за картографски издания)
801* поле за първоначален източник на записа
Полетата, маркирани със звездичка (*) трябва да присъстват във всеки запис без изключение.
Когато обаче записи се конвертират директно или чрез компютърен алгоритъм във формат UNIMARC и не е възможно да се получат смислени стойности на полетата от горния списък, те не се разглеждат като задължителни. Например поле 101 се пропуска, когато записът съдържа само 101 |#$a|||. Документацията трябва да информира ползвателя за пропуснатото (вж и приложение К).
Дължината на записите, която е ограничена от формата до 99,999 знака, е предмет на споразумение между страните, които извършват обмен.
В практиката има ситуации, когато по желание може да се направи връзка от едно библиографско описание към друго. Например: когато се прави запис за преводно съчинение той може да се свърже със записа за оригинала или при промяна в наименованието на серията може да се направи връзка между заглавията, принадлежащи към старото и новото наименование на серията. В UNIMARC е предвиден начин за създаване на такива връзки. За тази цел са предназначени полетата от блок 4 и повече информация може да се намери в описанието на тези полета и в увода към блок 4.
Полето за връзка между записите включва описателна информация, отнасяща се до другата библиографска единица с или без сведения за отделния запис, който описва единицата. Полето за връзка между записите се състои от подполета всяко от които съдържа поле от формата UNIMARC , състоящо се от етикет, индикатори и съдържание на полето, включително и маркери за подполета. Трябва да се отбележи, че тези въведени полета не са достъпни чрез директорията, тъй като неин компонент е само полето за връзка между записите като цяло. Етикетът на полето за връзка между записите означава връзката на единицата, идентифицирана в него, с единицата, за която се прави записът.
За обмен на данни в UNIMARC се използват стандартите на ISO за набори от символи. Маркерът на записа, директорията, индикаторите, идентификаторите за подполета и кодовете за стойности, определени в този документ, трябва да се кодират като се използват контролните функции и графичните символи от ISO 646 (IRV), които се приемат като предeфинирани за записа.Техниките за разширяване на кодовете, посочени в ISO 2022 се използват, когато за записа са необходими много набори от символи. Позициите на символи 26-29 и 30-33 от подполе $a в поле 100 се използват за въвеждане на предефинирани или допълнителни набори от графични символи, използвани в записа. Наборите от символи трябва да бъдат установени и регистрирани от ISO, но могат и да бъдат и предмет на споразумение между страните, които обменят записи.
В записите във формат UNIMARC се допускат контролните символи от ISO 646, а следните символи се използват винаги:
ISl от ISO 646 (позиция 1/15 в 7-битова кодова таблица): първият символ от двусимволен идентификатор за подполе.
ISl от IS2 от ISO 646 (позиция 1/14 в 7-битова кодова таблица): разделител за поле, намиращ се в края на директорията и на всяко поле от данни.
IS3 от ISO 646 (позиция 1/13 в 7-битова кодова таблица): разделител за запис, намиращ се в края на всеки запис.
Когато е необходим допълнителен набор от символи, често се използва контролната функция ESC на ISO 646. За данните в UNIMARC се допускат и две контролни функции от ISO 6630, използвани за сортиране.
Има четири възможни ситуации, когато данните могат да бъдат повторени в различни форми:
Записването на алтернативни графични представяния/азбуки в полета 001-099 и 200-899 се осъществява с използване на определител за съдържание към съответните данни. В този случай всички полета на UNIMARC могат да се смятат за повтарящи се независимо дали това е посочено в основния текст или не. Полетата, които са определени като неповтарящи се, се използват за алтернативни графични представяния/шрифтове в записа само веднъж.
Тази технология предоставя механизъм за записване на транскрипции на латиница, транслитерации и алтернативни азбуки или правопис, изготвени от библиографските агенции. съобразно стандартни таблици, правила, препоръки и др.
Във всяко поле, повторено с цел да се запише алтернативно графично представяне/азбука, се включват едновременно подполе $6 (данни за връзки между полетата) и когато е подходящо, подполе $7 (азбука/шрифт на полето). За използването на $6 и $7 се спазват следните указания:
$6 Данни за връзка между полетата
Данните, въвеждани в $6 се записват както следва:
Наименование на елемент от данни | Брой на символите | Позиция на символите |
Код за обясняване на връзката Номер на връзката Етикет на свързаното поле |
1 2 3 |
0 1-2 3-5 |
$6/0 Код за обясняване на връзката
a = алтернативно графично представяне/азбука
z = друго основание за връзка
$6/1-2 Номер на връзката
$6/3-5 Етикет на свързаното поле
$7 Азбука/шрифт на полето
Според препоръките на част 1 на ISO 2022, където се казва: &qut;Кодовете [за набора от знаци] са замислени да бъдат използвани за данни, които се обработват в постъпателна последователност" се допуска, че символите са въведени в логичен ред. Там, където данните са въведени така, че трябва да са четат отдясно наляво (например на арабски или иврит) това се означава с '/r' след кода. ISO 2022 Част 1 гласи също, че "Използването на тези кодове във връзка с данни, които се обработват по някакъв друг начин или са включени в данни, структурирани за обработка на записи с определена дължина, може да има нежелателни резултати или може да изисква допълнително специална обработка за осигуряване на коректна интерпретация." (Пример 4). Незадължително. Неповтарящо се.
Примери:
Пример 1
Три групи от по две паралелни полета съдържат имена на лица, представени с китайска азбука и с латиница. Първото поле във всеки от случаите не съдържа $7, защото то е на същата азбука като кодираната от поле 100. Свързващите номера са последователни, въпреки че могат да бъдат и в произволен ред.
Пример 2
Две полета за паралелни заглавия, съдържащи версии на заглавието, написани с корейска азбука и с латиница. В първото поле липсва $7, защото то е на същата азбука като кодираната от поле 100 със символна позиция 34-35, т.е.. "ka" (корейска).
Пример 3
Полета за препратка за двама съавтори, всеки от които е записан на японска азбука канджи, японска азбука кана и латинизирана форма. Полетата, изписани на канджи не съдържат подполе $7, защото от поле 100 личи, че азбуката на заглавието е канджи. Свързващите номера са определени произволно.
Пример 4
Ръководство за UNIMARC
© Copyright 2002 СБИР |
следва: Основна информация заа маркера |