Главная Обратная связь

Дисциплины:

Архитектура (936)
Биология (6393)
География (744)
История (25)
Компьютеры (1497)
Кулинария (2184)
Культура (3938)
Литература (5778)
Математика (5918)
Медицина (9278)
Механика (2776)
Образование (13883)
Политика (26404)
Правоведение (321)
Психология (56518)
Религия (1833)
Социология (23400)
Спорт (2350)
Строительство (17942)
Технология (5741)
Транспорт (14634)
Физика (1043)
Философия (440)
Финансы (17336)
Химия (4931)
Экология (6055)
Экономика (9200)
Электроника (7621)






ТЕМА 9. ОПИСАНИЕ СХЕМЫ ДОКУМЕНТА НА ЯЗЫКЕ XSD



 

Для более точного описания схемы документа, учитывающего тип содержимого элемента, количество повторений вложенного элемента и другие подробности, в мае 2001 года консорциум W3C рекомендовал описывать структуру документов XML на новом языке описания схем XSD (XML Schema Definition Language). На этом языке записывается схема XML (XML Schema), описывающая конструкции, использованные в документе XML.

Язык XSD создан как реализация XML. Это значит, что схема XML сама записывается в виде документа XML. Ее элементы называют компонентами (components), чтобы отличить их от элементов описываемого документа XML. Корневой компонент схемы носит имя schema. Компоненты схемы описывают элементы XML и определяют различные типы элементов. Рекомендация схемы XML перечисляет 13 типов компонентов, но наиболее важны компоненты, определяющие простые и сложные типы элементов, сами элементы и их атрибуты.

Язык XSD различает простые и сложные элементы XML. Простыми (simple) элементами описываемого документа XML считаются элементы, не содержащие атрибутов и вложенных элементов. Соответственно, сложные (complex) элементы содержат атрибуты и/или вложенные элементы. Схема XML определяет простые типы — типы простых элементов, и сложные типы — типы сложных элементов.

Язык описания схем содержит множество встроенных простых типов, перечисленных в следующем разделе.

 

Встроенные простые типы XSD

 

Встроенные типы языка описания схем XSD позволяют записывать двоичные и десятичные целые числа, вещественные числа, дату и время, строки символов, логические значения, адреса URI. Рассмотрим их по порядку.

 

Вещественные числа

 

Вещественные числа в языке XSD разделены на три типа: decimal, float и double.

Тип decimal составляют вещественные числа, записанные с фиксированной точкой: 123.45, —0.1234567689345 и т. д. Фактически хранятся два целых числа. Одно число представляет мантиссу, другое — порядок вещественного числа. Спецификация языка XSD не ограничивает количество цифр в мантиссе, но требует, чтобы можно было записать не менее 18 цифр. При обработке документа средствами технологии Java этот тип легко реализуется, например, классом java.math.BigDecimai, входящим в стандарт Java API.

Типы float и double соответствуют стандарту IEEE754-85 и одноименным типам Java. Они записываются с фиксированной или с плавающей десятичной точкой. Например, 34.567, -45.67, 1е-5, 34.58е14.



 

Целые числа

 

Основной целый тип integer понимается как подтип типа decimal, содержащий числа с нулевым порядком. Это целые числа с любым количеством десятичных цифр: -34567, 123456789012345 и т. д. При использовании средств Java для обработки документа этот тип легко реализуется классом java.math.Biglnteger.

Типы long, int, short и byte полностью соответствуют одноименным типам Java. Они понимаются как подтипы типа integer, типы более коротких чисел считаются подтипами более длинных чисел, например тип byte - это подтип типа short, оба они подтипы типа int и т. д.

Значения типа byte, как следует из его названия, занимают один байт и изменяются от -128 до 127. Тип short занимает два байта, его значения лежат в диапазоне от -32768 до +32767. Числа типа int хранятся в четырех байтах и меняются от -214748.3648 до +2147483647. Наконец, тип long располагается в восьми байтах, его значения от -9223372036854775808 до +9223372036854775807.

Типы nonPositiveInteger и negativeInteger - подтипы типа integer - составлены из неположительных и отрицательных чисел соответственно с любым количеством цифр.

Типы nonNegativeInteger И positiveInteger – подтипы типа integer — составлены из неотрицательных и положительных чисел соответственно с любым количеством цифр.

У типа nonNegativeInteger есть подтипы целых чисел без знака unsignedLong, unsignedInt, unsignedShort и unsignedByte.

 

Строки символов

 

Основной символьный тип string описывает произвольную строку символов Unicode. Его можно реализовать средствами Java, используя класс Java.lang.String.

Тип normalizedstring — подтип типа string — это строки, не содержащие символов перевода строки '\n' возврата каретки '\г' и горизонтальной табуляции '\t'.



В строках типа token — подтипа типа normaiizedstring — нет, кроме того, начальных и завершающих пробелов и нескольких подряд идущих пробелов. В типе token выделены три подтипа. Подтип language определен для записи названия языка согласно рекомендации RFC 1766, например, ru, en, de, fr. Подтип NMTOKEN используется только в атрибутах для записи их перечисляемых значений. Подтип name составляют имена XML — последовательности букв, цифр, дефисов, точек, двоеточий, знаков подчеркивания, начинающиеся с буквы (кроме зарезервированной последовательности букв х, х, м, m, L, l в любом сочетании регистров) или знака подчеркивания. Мы видели в предыдущих главах, что имена, начинающиеся со стороки xml, используются самой спецификацией XML, например, имя атрибута xmlns. Двоеточие в значениях типа name применяется для выделения префикса в уточненных именах при использовании пространства имен.

Из типа name выделен подтип NCName (Non-Colonized Name) имен, не содержащих двоеточия, в котором, в свою очередь, определены три подтипа: ID, ENTITY, IDREF, — описывающие идентификаторы XML, примитивы и перекрестные ссылки на идентификаторы.

 

Дата и время

 

Тип duration описывает промежуток времени, например, запись P1Y2M3DT10H30M45S означает один год (IY), два месяца (2м), три дня (3D), десять часов (юн), тридцать минут (зом) и сорок пять секунд (45s). Запись может быть сокращенной, например, Р120М означает 120 месяцев, а Т120М — 120 минут.

Тип dateTime содержит дату и время в формате ccYY-MM-DDThh:mm:ss, например, 2003-04-25Т09:30:05. Остальные типы выделяют какую-либо часть даты или времени.

Тип time содержит время В обычном формате hh:imr.ss.

Тип date содержит дату в формате CCYY-MM-DD.

Тип gYearMonth выделяет год и месяц в формате CCYY-MM.

Тип gMonthDay содержит месяц и день месяца в формате -MM-DD.

Тип gYear означает год в формате CCYY, тип gMonth — месяц в формате -MM-, тип gDay — день месяца в формате - DD.

 

Двоичные типы

 

Двоичные целые числа записываются либо в шестнадцатеричной форме без всяких дополнительных символов: 0B2F, 356С0А и т. д., это тип hexBinary, либо в кодировке Base64, это типbase64Binary.

 


Эта страница нарушает авторские права

allrefrs.ru - 2019 год. Все права принадлежат их авторам!