Элементы управления разметкой



Тема 13. Язык гипертекстовой разметки HTML. [1,2.7]

Принципы построения и интерпретации. Заголовок документа HTML. Тело документа. Элементы управления разметкой. Гипертекстовые ссылки. Средства описания miltimedia-информации. Средства описания стилей, таблиц и математических формул.

Язык гипертекстовой разметки HTML

Язык гипертекстовой разметки HTML (HyperText Language) был предложен Тимом Бернерсом-Ли в 1989 году в качестве одного из компонентов технологии разработки распределенной гипертекстовой системы World Wide Web. Разработчики HTML пытались решить две задачи:

· дать дизайнерам гипертекстовых баз данных простое средство создания документов;

· сделать это средство достаточно мощным, чтобы отразить имевшиеся на тот момент представления об интерфейсе пользователя гипертекстовых баз данных.

Первая задача была решена за счет выбора таговой модели описания документа. Такая модель широко применяется в системах подготовки документов для печати. Примером такой системы является хорошо известный язык разметки научных документов ТеХ, предложенный Американским Математическим Обществом, и программы его интерпретации.

К моменту создания HTML существовал стандарт языка разметки печатных документов - Standard Generalised Markup Language, который и был взят в качестве основы HTML. Предполагалось, что такое решение поможет использовать существующее программное обеспечение для интерпретации нового языка. Однако, будучи доступным широкому кругу пользователей Internet, HTML зажил своей собственной жизнью. Вероятно, многие администраторы баз данных WWW и разработчики программного обеспечения для этой системы имеют довольно смутное представление о стандартном языке разметки SGML.

Вторым важным моментом, повлиявшим на судьбу HTML, стал выбор в качестве элемента гипертекстовой базы данных обычного текстового файла, который хранится средствами файловой системы операционной среды компьютера. Такой выбор был сделан под влиянием следующих факторов:

· такой файл можно создать в любом текстовом редакторе на любой аппаратной платформе в среде любой операционной системы;

· к моменту разработки HTML существовал американский стандарт для разработки сетевых информационных систем - Z39.50, в котором в качестве единицы хранения указывался простой текстовый файл в кодировке LATIN 1, что соответствует US ASCII.

Таким образом, гипертекстовая база данных в концепции WWW - это набор текстовых файлов, написанных на языке HTML, который определяет форму представления информации (разметка) и структуру связей этих файлов (гипертекстовые ссылки).

Такой подход предполагает наличие еще одной компоненты технологии - интерпретатора языка. В World Wide Web функции интерпретатора разделены между сервером гипертекстовой базы данных и интерфейсом пользователя. Сервер, кроме доступа к документам и обработки гипертекстовых ссылок, осуществляет также препроцессорную обработку документов, в то время как интерфейс пользователя осуществляет интерпретацию конструкций языка, связанных с представлением информации.

К настоящему времени известна уже третья версия языка - HTML 3.0, которая находится в стадии развития. Если первая версия языка (HTML 1.0) была направлена на представление языка как такового, где описание его возможностей носило скорее рекомендательный характер, вторая версия языка (HTML 2.0) фиксировала практику использования конструкций языка, версия ++ (HTML++) представляла новые возможности, расширяя набор элементов HTML в сторону отображения научной информации и таблиц, а также улучшения стиля компоновки изображений и текста, то версия 3.0 призвана упорядочить все нововведения и согласовать их с существующей практикой. Кроме этого в версии 3.0 снова делается попытка формализации интерфейса пользователя гипертекстовой распределенной системы.

Принципы построения и интерпретации HTML

Таговая модель описывает документ как совокупность элементов, каждый из которых окружен тагами. По своему значению таги близки к понятию скобок "begin/end" в универсальных языках программирования, которые задают области действия имен локальных переменных и т. п. Таги определяют область действия правил интерпретации текстовых элементов документа. Типичным примером такого рода является таг стиля Italic, который определяет область отображения курсива.

Текст на языке HTML:

Текст, следующий за словом "Italic", <I>отображается как курсив</I>.

Текст, отображаемый программой интерпретации:

Текст, следующий за словом "Italic", отображается как курсив.

В приведенном выше примере элемент текста, который должен быть выделен курсивом, заключен между тагом начала стиля "Italic" - < I> и тагом конца стиля - < /I>. Общая схема построения элемента текста в формате HTML может быть записана в следующем виде:

"элемент" := <"имя элeмeнтa" "список атрибутов">

содержание элемента </"имя элемента">

Конструкция перед содержанием элемента называется тагом начала элемента, а конструкция, расположенная после содержания элемента - тагом конца элемента.

Структура гипертекстовой сети задается гипертекстовыми ссылками. Гипертекстовая ссылка - это адрес другого HTML-документа, который тематически, логически или каким-либо другим способом связан с документом, в котором ссылка определена.

Для записи гипертекстовых ссылок в системе WWW была разработана специальная форма, которая называется Universe Resource Locator. Типичным примером использования этой записи можно считать следующий пример:

Этот текст содержит <А HREF="http://polyn.net.kiae.su/altai/ index. html">гипертекстовую ссылку</А>.

В приведенном выше примере элемент "А", который в HTML называют якорем (anchor), использует атрибут "HREF", который обозначает гипертекстовую ссылку (Hypertext REFerence), для записи этой ссылки в форме URL. Данная ссылка указывает на документ с именем "index.html" в директории "altai" на сервере "polyn.net.kiae.su", доступ к которому осуществляется по протоколу "http".

Гипертекстовые ссылки в HTML делятся на два класса: контекстные гипертекстовые ссылки и общие. Контекстные ссылки вмонтированы в тело документа, как это было продемонстрировано в предыдущем примере, в то время как общие ссылки связаны со всем документом в целом и могут быть использованы при просмотре любого фрагмента документа. Оба класса ссылок присутствуют в стандарте языка с самого его рождения, однако, первоначально наибольшей популярностью пользовались контекстные ссылки. Эта популярность привела к тому, что механизм использования общих ссылок практически полностью "атрофировался". Однако по мере стандартизации интерфейса пользователя и стилей представления информации разработчики языка снова вернулись к общим ссылкам и стремятся приспособить их к задачам управления этим интерфейсом.

Структура HTML-документа позволяет использовать вложенные друг в друга элементы. Собственно, сам документ - это один большой элемент с именем "HTML":

<HTML> Содержание документа </HTML>

Сам элемент HTML или гипертекстовый документ состоит из двух частей: заголовка документа (HEAD) и тела документа (BODY):

<HTML>

<HEAD>

Содержание заголовка

</HEAD>

<BODY>

Содержание тела документа

</BODY>

</HTML>

Все, что расположено между <HTML> и </HTML> - это документ. Содержание элемента HEAD определяет заголовок документа, который состоит из двух элементов: TITLE и BASE. Вслед за заголовком начинается тело документа, которое содержит в своих первых строках некоторую вводную информацию и содержание документа, оформленное в виде списка.

Каждый документ в системе World Wide Web имеет свое имя, которое указывается в элементе TITLE заголовка документа. Его мы видим в первой строке интерфейса. Вслед за TITLE в заголовке указан элемент BASE. Этот элемент не отображается, однако содержание его атрибута используется при задании адреса графической картинки в элементе BODY. Картинка - "back.gif" - задана частичной формой спецификации URL, которая не задает полного адреса ресурса в сети. Элемент BASE заголовка помогает восстановить этот адрес. Первым элементом тела документа является его название, которое оформляется в виде заголовка первого уровня - H1.

Обычно для отображения таких заглавий используют самый крупный шрифт. Выделение элементов цветом показывает, что это гипертекстовые ссылки, которые записаны в виде тагов:

<А НRЕF="#list">Создание списка</A>

Решетка перед словом "list" означает, что это ссылка на метку внутри документа, которая определена как:

<А NAMF="list">

При выборе гипертекстовой ссылки происходит переход на указанную в ссылке метку.

Начало нового параграфа определяется тагом <Р>. Таг конца параграфа не требуется, т к при вводе тaгa <Р> старый параграф кончается, а новый начинается. Конец параграфа определяется и рядом других тагов. Параграф заканчивается, если начинается список, например. Выделение заглавий осуществляется тагами заглавий разного уровня. В данном примере все разделы документа выделены как заголовки второго уровня:

<Н2>Выделение заголовков</Н2>

Следует обратить внимание еще на два тага: <HR> и <BR>. Первый вызывает подведение сплошной черты под текстом на всю ширину рабочей области интерфейса, а второй вызывает принудительный перевод строки. В принципе, программа интерфейса пользователя автоматически вписывает текст в окно рабочей области интерфейса, поэтому все концы строк в исходных файлах игнорируются. Но часто бывает полезно принудительно перевести строку. Для этой цели и используется таг <BR>.

Нумерованный список начинается с тага <OL> и заканчивается тагом </OL>. От ненумерованного он отличается тем, что перед каждым элементом списка проставляется номер по порядку. В языке существует еще несколько видов списков.

Встроенный графический образ монтируется в текст при помощи тага <IMG...>. Программа интерпретации языка сначала запрашивает собственно текст документа у сервера гипертекстовой базы данных, а затем, по мере просмотра, графические образы, которые должны быть подготовлены в форматах GIF и JPEG. Первый формат более предпочтителен.

Данный пример призван был продемонстрировать сам принцип построения и отображения гипертекстовых документов, написанных на языке HTML. Перейдем к более подробному обсуждению конструкций и возможностей языка.

Заголовок документа HTML

Заголовок документа не имеет атрибутов. По сложившейся традиции, таги начала и конца заголовка могут быть опущены. Элементы заголовка должны правильно интерпретироваться и в этом случае. Игнорирование тагов заголовка стало возможным благодаря тому, что множества имен элементов тела и заголовка не пересекаются. Следует отметить, что с появлением возможности определения имен пользователем через элемент МЕТА в третьей версии языка появилась возможность ошибки при интерпретации документа. Поэтому в стандарте языка настоятельно рекомендуется не вводить имена, совпадающие со стандартными.

Основное назначение элементов заголовка - это описание общих для всего документа параметров отображения. К таким параметрам можно отнести стиль отображения документа, общий базовый адрес гипертекстовых ссылок, общие гипертекстовые ссылки, идентификатор и имя документа и т. п.

Для описания элементов заголовка рассмотрим структуру типичного интерфейса пользователя системы WWW. Интерфейс включает поля управления и поля отображения информации. Многие поля управления могут быть заданы в документе HTML. Это позволяет администратору-автору гипертекстовой базы данных управлять просмотром не только через систему встроенных гипертекстовых ссылок, но и перепрограммируя интерфейс пользователя. Рассмотрим значения полей подробнее.

В верхнем поле интерфейса рядом с названием интерфейса отображается имя документа, которое указывается в его заголовке. Ниже, сразу под именем документа, отображается меню управления программой. Некоторые его позиции могут быть определены через общие гипертекстовые ссылки, такие, например, как список "закладок" или системный "Help". Ряд режимов системного меню вынесен в меню пиктограмм, в котором "домик" обозначает переход на "домашнюю" страницу пользователя, стрелка "назад" - переход на предыдущий документ, стрелка "вперед" - на следующий, символ факсимильного аппарата - просмотр новостей, почтовый конверт - отправку почты, а знак вопроса - системный "Help". Все из перечисленных пиктограмм могут быть назначены в заголовке отображаемого документа. Под рядом пиктограмм отображается адрес просматриваемого документа в форме URL. Это же поле можно использовать и для ввода адреса другого документа вручную. Сразу под адресом начинается поле отображения текста документа. В тексте цветом выделены контекстные гипертекстовые ссылки.

В нижней части экрана указано еще одно поле, которое управляется заголовком HTML-документа. Это поле поиска документов по ключевым словам, которое позволяет использовать WWW в режиме информационно-поисковой системы.

Большинство полей заголовка будут связаны либо с системой меню и полями интерфейса пользователя, либо со стилем отображения документа, либо с системой гипертекстовых ссылок.

TITLE. Наиболее часто используемым элементом заголовка является имя документа. TITLE имеет следующий синтаксис:

<TITLE> Название документа</TITLE>

Содержание элемента TITLE отображается в поле названия документа.

BASE. Элемент BASE связан с формой представления гипертекстовой ссылки в форме URL. Спецификация URL определяет две формы адресации документов: полную и неполную. HTML разрешает использовать как полную форму адресации URL, так и неполную. Но для того чтобы использовать вторую форму спецификации, ее надо на чем-то базировать, т.е. задавать базовый адрес, который можно было бы использовать для формирования полной формы URL из неполной. Элемент BASE позволяет определить эту базу. Так, например, если в заголовке будет задано:

<BASE HREF="http://polyn.net.kiae.su/>, гипертекстовая ссылка вида:

<HREF="/altai/index.html"> будет расширена до:

<A HREF="http://polyn.net.kiae.su/ altai/index.html">

Это тоже касается и других импортируемых в документ элементов. Графический образ, монтируемый в документ по команде:

<IMG SRC="/gif/test.gif"> будет найден по адресу:

<IMG SRC="http://polyn.net.kiae.su/gif/test.gif">

Содержание элемента BASE интерфейсом пользователя не отображается.

ISINDEX.Использование HTML-документа для ввода запроса на поиск по ключевым словам определяется элементом ISINDEX заголовка документа. В первоначальной версии языка данный элемент не имел дополнительных атрибутов. Если сервер мог выполнить запрос по ключевым словам, то он автоматически вставлял в заголовок элемент ISINDEX. Список ключевых слов приписывался клиентом к адресу документа после символа "?". Понятно, что выполнить запрос мог сервер, который при наличии символа "?" превращался в поисковую машину. HTML-документ мог быть сгенерирован "на лету" программой, тогда ключевые слова после "?" приписываются к адресу этой программы. В новой версии языка появилась возможность указать программу обработки запроса и задать фразу вместо стандартной "SEARCH INDEX":

<ISINDEX HREF="http://polyn.net.kiae.su/cgi-bin/search"

PROMPT="Enter Keywords:">

В приведенном примере атрибут HREF определяет адрес программы обработки запроса, а атрибут PROMPT - содержание приглашения. Справедливости ради стоит отметить, что полностью новые возможности этого элемента выполняет только один интерфейс - Arena. Такие популярные интерфейсы, как Mosaic и Netscape, данный элемент интерпретируют по-старому.

LINK. Этот элемент заголовка используется для описания общих для всего документа гипертекстовых ссылок. Элемент имеет три атрибута: REL, REV и HREF. REL задает тип ссылки, REV задает обратную ссылку, а HREF определяет ссылку в форме URL. Наличие этого элемента в заголовке HTML-документа отражает сам факт существования гипертекстовых ссылок данного класса Однако, в сети практически нет документов, которые имели бы такой элемент в своем заголовке. Связано это с тем, что реализация такой ссылки в интерфейсе пользователя была не ясна и, как следствие, разработчики интерфейсов не включали реализацию данного класса ссылок в свои программы. В третьей версии языка удалось найти логичное применение элементу LINK. На данный элемент возложили нагрузку по программированию средств управления интерфейсом пользователя. С этой целью ввели несколько стандартных классов отношений, которые указываются в атрибуте REL:

Ноmе  адрес домашней страницыТоС       адрес содержания документаIndex адрес индекса терминовGlossary  глоссарийCopyright права копирайтаUp    адрес вышестоящего документа при иерархической      структуре гипертекстовой сетиNext      следующий документ при линейном просмотреPrevious  предыдущий документ при линейном просмотреHelp  адрес документа с информацией "Help"Bookmark  адрес файла закладок

При выборе соответствующей позиции в меню интерфейса пользователя или соответствующей этой позиции пиктограммы программа интерфейса должна генерировать запрос к серверу на получение документа, указанного в атрибуте HREF. Например:

<LINK REL=Help HREF="http://polyn.net.kiae.su/dss/syshelp. html">

Данное предложение в заголовке HTML-документа означает, что при выборе режима "Help" на экране отобразится документ, который хранится по адресу http://polyn.net.kiae.su/dss/syshelp.html. В данном случае появляется возможность строить контекстно-зависимые help'ы для систем, построенных по технологии WWW, а не получать в виде подсказки инструкции по использованию программы Netscape, например.

Другое полезное применение LINK, которое рекомендует новый стандарт, - это вставка постоянной заставки (banner) в начало каждого документа просматриваемой базы данных. Как правило, каждый разработчик снабжает свои документы небольшой порцией информации, которая появляется в начале каждого документа.

В настоящее время эту информацию приходится копировать из документа в документ. При разработке сервера NCSA была возможность препроцессорной вставки такой информации сервером, но при работе с новыми программами она автоматически не отрабатывает, а настройка каждого клиента на работу с таким сервером не оправдана. Новый механизм выглядит так:

<LINK REL=Banner HREF=banner.html>

В последнее время предложены и другие способы использования элемента LINK, но они еще не вошли в стандарт.

МЕТА.Элемент МЕТА предназначен для определения в заголовке документа конструкций, отсутствующих в спецификации HTML. Имеет три атрибута: NAME, CONTENT, HTTP-EQUIV. Применение данного элемента затруднено тем, что для интерпретации конструкций, которые вводятся через этот элемент, необходимо, чтобы сервер или интерфейс пользователя мог эти конструкции расшифровать и применить. Для такого сорта работы программа должна уметь интерпретировать конструкции SGML, что практически не реализовано ни в одной интерфейсной программе. Единственным способом применения данного элемента на практике является включение в заголовок отклика по протоколу HTTP информации, определенной через атрибут НТТР-EQUIV:

<МЕТА HTTP-EQUIV="Keywords" CONTENT="Plsma, Nuclear Physics">

При таком использовании в заголовок HTTP-пакета будет включена строка:

Keywords: Plasma, Nuclear Physics,

что удобно при отправке почты, например.

STYLE. Элемент Style предназначен для того, чтобы автор гипертекстового документа мог задать стиль отображения своего документа: назначить фонты для отображения заголовков, списков и других элементов текста, назначить размер шрифтов встроенных меню, примеров, ссылок и т. п. Для этого элемента разработан специальный механизм описания, конструкции которого задаются в атрибуте NOTATION. При использовании этого элемента следует учитывать тот факт, что, с одной стороны, мало какие программы понимают его (только частично Arena), а с другой, не все пользователи имеют возможность реализовать сложные графические описания. Около 2/3 всех пользователей, которые обращались за информацией к базе данных автора, отключают в своих интерфейсах запросы на передачу графической информации. В этой ситуации навязчивый сервис может вызвать раздражение.

Другие элементы заголовка носят декларативный характер, обозначая скорее намерения, чем реальную практику их использования.

Тело документа

Элементы тела документа предназначены для управления отображением информации в программе интерфейса пользователя. Они описывают гипертекстовую структуру базы данных при помощи встроенных в текст контекстных гипертекстовых ссылок. Тело документа со стоит из:

· иерархических контейнеров и заставок;

· заголовков (от H1 до Н6);

· блоков (параграфы, списки, формы, таблицы, картинки и т.п.);

· горизонтальных отчеркиваний и адресов;

· текста, разбитого на области действия стилей (подчеркивание, выделение, курсив), математических описаний, графики и гипертекстовых ссылок.

BODY. Описание элементов тела документа следует начать с элемента BODY. В отличие от элемента HEAD, элемент BODY имеет атрибуты:

ID - идентификатор элемента. Используется для именования элементов, а также в качестве точки перехода по гипертекстовой ссылке Данный атрибут имеется практически во всех элементах тела документа. С точки зрения практического использования идентификатора BODY в качестве точки перехода по гипертекстовым ссылкам, использование этого атрибута сомнительно, т.к. отображаемая часть документа собственно и начинается с этого элемента.

LANG - определяет язык документа в виде двухсимвольного кода ISO-639, за которым следует через точку необязательный код страны в формате ISO-3166. По замыслу разработчиков стандарта языка данный атрибут должен распознаваться программами интерпретации и управлять отображением многоязычных текстов. Однако, даже Arena, специально предназначенная для иллюстрации HTML 3.0, не реализует этой возможности.

CLASS - иерархически организованное имя типа "ADDITION.FIRST". Предназначено для связывания элемента текста с определенным стилем отображения. Реально пока не используется. Все три вышеперечисленных атрибута являются общими для элементов тела и в дальнейшем мы их обсуждать не будем. Если атрибут не будет разрешен для элемента тела текста документа, то это будет указано специально.

BACKGROUND - определяет фон, на котором отображается текст документа. В примере HTML-документа в качестве фона был использован небольшой графический образ "back.gif":

<BODY BACKGROUND="file:///CI/text/doc/cource/back.gif">

Как видно из этого примера, в качестве значения данного атрибута используется адрес в форме URL. В данном случае это адрес локального файла.

Следует заметить, что разные интерфейсы пользователя поддерживают различные дополнительные атрибуты для элемента BODY. Так Netscape и Mosaic поддерживают следующие дополнительные атрибуты:

     Атрибут         Значение
BGCOLOR=#FFFFFF Цвет фона
TEXT=#0000FF Цвет текста
VLINK=#FF0000 Цвет пройденных гипертекстовых ссылок
LINK=#00FF00 Цвет гипертекстовой ссылки

В данной таблице строка #ХХХХХХ определяет цвет в терминах RGB в шестнадцатеричной нотации. Так цвет текста определен как синий, фона - белый, пройденные ссылки красные, а новые ссылки зеленые. В качестве тага начала элемента BODY можно указать:

<BODY GCOLOR=#FFFFFF TEXT=#OOOOFF

VLINK=#FFOOOO LINK=#OOFFOO>

Однако пользоваться этими атрибутами следует крайне осторожно, т. к. у пользователя может оказаться другой интерфейс, который эти параметры не интерпретирует.

 

Элементы управления разметкой

BANNER. Заставки используются в HTML для того, чтобы на каждой странице документа можно было представить одну и ту же информацию, скажем логотип разработчика базы данных. В данном случае в текст документа был включен элемент:

<BANNER><IMG SRC="back.gif" > Это логотип. </BANNER>

Данный элемент поддерживается только программой Arena.

DIV. Данный элемент предназначен для разбиения текста на фрагменты с дальнейшей идентификацией стиля отображения каждого фрагмента. Реально данная возможность реализована только в Arena, и то не полностью, поэтому ограничимся поясняющим примером:

<DIV CLASS=Abstract>

<Р> This is abstract.

</DIV>

Заголовки. Заголовки обозначают начала разделов документа. В стандарте определено 6 уровней заголовков: от H1 до Н6. Некоторые программы, например Mosaic, позволяют использовать большее число уровней заголовков, однако реально более трех уровней встречается редко, а более 5 - крайне редко. Стандарт языка насчитывает 11 атрибутов у элемента заглавие. Рассмотрим только ALIGN, т к. остальные в большинстве программ-интерпретаторов не реализованы На приведенном ниже примере при отображении заголовка первого уровня заказано центрирование:

<Н1 АLIGN=СENTER>Простой пример HTML документа. </Н1>

Таблица 7.1 определяет возможные значения атрибута ALIGN.

Значение Justify реализовано не во всех программах интерпретации.

Таблица 7.1. Значение атрибута ALIGN в текстовых тагах

  Значение     Описание применения 
Left Выравнивание по левому краю
Right Выравнивание по правому краю
Justify Выравнивание по левому и правому краям
Center Центрирование

Во многих интерпретаторах реализован элемент <CENTER>... </CENTER> для центрирования текста (Mosaic, Netscape), который можно использовать вместо атрибута ALIGN.

Параграф(<P>).Элемент "параграф" применяется для разбиения текста на параграфы. Он имеет три полезных с точки зрения отображения текста атрибута: ALIGN, CLEAR и NOWARP.

С практикой использования ALIGN мы уже познакомились на примере использования этого атрибута в заглавиях.

Атрибут CLEARприменяется в случаях обтекания текстом графики или таблиц. Если автор не хочет управлять обтеканием, то он применяет CLEAR. Таким образом данный атрибут позволяет управлять межстрочным интервалом. CLEAR является общим для всех блочных элементов (заглавия, параграфы и т п ), однако, реализован далеко не для всех из них. Реальное обтекание текста реализовано только в Netscape и Arena и в нескольких коммерческих интерфейсах, поэтому строить дизайн гипертекстовых страниц на основе этих возможностей следует с известной долей осторожности CLEAR может принимать следующие значения (табл. 7.2).

Таблица 7.2. Значение атрибута CLEAR

Значение Назначение
left Пропустить картинку, расположенную у левого края листа
right Пропустить картинку или таблицу, расположенную у правого края листа
all Прервать отображение текста перед картинкой или таблицой и продолжить ниже

В атрибуте CLEAR можно указать и численные значения:

<Р CLEAR="100 pix">

Данная запись означает пустое горизонтальное поле высотой в 100 пиксельных строк.

NOWARP. Автоматически все интерфейсы обязаны размещать текст только в пределах окна рабочей области, поэтому они осуществляют автоматическое разбиение текста на строки. Отмена этого режима осуществляется атрибутом NOWARP. Реализован только в Arena.

HR. Горизонтальное отчеркивание применяется для разделения документа на части. Элемент имеет пять атрибутов. Первые три (ID, CLASS, CLEAR) paнее уже обсуждались. Атрибут SRC позволяет в качестве отчеркивания использовать не сплошную черту, а графический образ.

Совместно с атрибутом SRCможет использоваться атрибут MD, который содержит контрольную сумму для графического образа. Используется для контроля передачи графики.

BRнужен чтобы нарушить стандартный порядок отображения текста. При обычном режиме интерпретации программа интерфейса пользователя отображает текст в рабочем окне, автоматически разбивая его на строки. В этом режиме существующие в тексте концы строк игнорируются. Иногда для большей выразительности требуется начать печать с новой строки. Для этой цели и используется элемент BR. Элемент BR имеет атрибуты ID, LANG, CLASS, CLEAR. Все эти атрибуты обсуждались ранее.

Элементы управления отображением символов. Все эти элементы можно разбить на два класса: элементы, управляющие формой отображения (font style), и элементы, характеризующие тип информации (information type). Часто внешне разные элементы при отображении дают одинаковый результат. Это зависит главным образом от настроек интерпретирующей программы и вкусов пользователя.

Таблица7.3. Элементы стиля

Элемент Значение  Примечание
<I>...</I> Курсив (Italic)  
<B>...</B> Усиление (Bold)  
<TT>...</TT> Телетайп  
<U>...</U> Подчеркивание  
<STRIKE>...</STRIKE>   Только Arena при наличии соответствующего фонта
<BIG>...</BIG> Перечеркнутый текст Только Arena
<SMALL>...</SMALL> Увеличенный текст Только Arena
<SUB>...</SUB> Уменьшенный фонт Только Arena
<SUP>...</SUP> Подстрочные символы Только Arena

 

Таблица 7.4. Информационные элементы

Элемент Значение Примечание
<EM>...</EM> Типографское усиление Часто отображается как Italic
<CITE>...</CITE> Цитирование Не реализовано в Mosaic
<STRONG>...</STRONG> Усиление Отображается как BOLD
<CODE>...</CODE> Отображает примеры кода Отображается непропорциональным фонтом
<SAMP>...</SAMP> Последовательность литералов Не реализован в Mosaic
<KBD>...</KBD> Пример ввода символов с клавиатуры Используется при разработке руководств
<VAR>...</VAR> Переменная  
<DFN>...</DFN> Определение Только Arena
<Q>...</Q> Текст, заключенный в скобки Вид скобок зависит от атрибута LANG. Реали- зован только в Arena
<LANG>...</LANG> Определяет язык отоб- ражения Только Arena
<AU>...</AU> Автор Только Arena
<PERSON>...</PERSON> Имя персоны Введено для простоты выделения при индексировании документов. Реализован только в Arena
<ACRONIM>... </ACRONIM> Акроним Только Arena
<ABBREV>... </ABBREV> Аббревиатура Только Arena
<INS>...</INS> Вставленный текст Только Arena
<DEL>...</DEL> Удаленный текст Только Arena

Все эти элементы допускают вложенность и пересечение друг другом, поэтому все они имеют таг начала и конца.

При использовании этих элементов следует помнить, что их отображение зависит от настроек программы-интерфейса пользователя, которые могут и не совпадать с настройками программы-разработчика гипертекста. Использование стилей, которые подменяют настройки интерфейса, в настоящий момент проблематично. Реально стили поддерживаются только одним интерфейсом - Arena, да и только частично. С другой стороны большое количество пользователей пользуется старыми программами, которые реализуют старые версии языка.

В Mosaic все приведенные стили реализованы по умолчанию и не могут быть настроены через файл настройки программы или через механизм определения стиля отображения документа. Из информационных стилей в Mosaic поддерживаются только <I>и <B>.

Списки. Списки являются важным средством структурирования текста и применяются во всех языках разметки. В HTML имеются следующие виды списков: ненумерованный список (неупорядоченный), нумерованный список (упорядоченный) и список определений. Существует несколько разновидностей ненумерованного списка, которые можно назначить свой стиль отображения.

Ненумерованный список. Ненумерованный список предназначен для создания элементов текста типа:

<UL>

<LI> <I> первый элемент списка </I> </LI>

<LI> <B> второй элемент списка </B> </LI>

<LI> <B> <I> третий элемент списка </I> </B> </LI>

</UL>

Записывается данный список в виде следующей последовательности HTML-предложений:

· первый элемент списка

· второй элемент списка

· третий элемент списка

Таги <UL> и </UL> - это таги начала и конца ненумерованного списка, таг <LI> (List Item) задает элемент списка. В дополнение к этим элементам существует элемент, позволяющий именовать списки - LH (List Header). В стандарте HTML 3.0 для этого типа списков приведено множество атрибутов,которые призваны управлять отображением списка, но реально они еще не реализованы ни одним интерпретатором языка.

Разновидностями ненумерованного списка является списки <DIR> и <MENU>.Эти списки заимствованы из HTML 1.0 и поддерживаются только для преемственности. Список <MENU> отображает элементы списка без предшествующих им bullet'ов, а список <DIR> призван разворачивать список горизонтально (по типу падающих меню). Однако не все интерфейсы поддерживают эти два типа списков. Так Mosaic, например, поддерживает <MENU>, но не поддерживает <DIR>.

Нумерованный список от ненумерованного отличается тем, что перед элементами списка проставляются номера. Приведем пример нумерованного списка:

<OL>

<B>Нумерованный список </B>

<LI>Элементы заголовка документа </LI>

<OL>

<LI>TITLE</LI>

<LI>BASE</LI>

<LI>LINK</LI>

</OL>

<LI>Элементы тела документа</LI>

<OL>

<LI>BODY </LI>

<LI>Heading </LI>

<LI>...</LI>

</OL>

</OL>

Отображается такой список следующим образом:

Нумерованный список

1. Элементы заголовка документа

1. TITLE

2. BASE

3. LINK

2. Элементы тела документа

1. BODY

2. Heading

3. ...

Третий вид списков - списки определений - отличаются от первых двух синтаксисом элементов списка.

Списками можно закончить обзор элементов управления отображением текста. Из этого класса остался еще один элемент, который реализован во всех программах интерпретации HTML - элемент <PRE>...</PRE>, который предназначен для отображения текста без форматирования.

Гипертекстовые ссылки

Все рассмотренные выше средства управления отображением текста являются безусловно важными, но только дополнительными к основному элементу документа - гипертекстовой ссылке. Для записи гипертекстовой ссылки используется элемент <А...>......</А>, который называют "якорь" (anchor). Якорь имеет несколько атрибутов, главным из которых является HREF (HyperText Reference). Простую ссылку можно записать в виде:

<А HREF="http://polyn.net.kiae.su/index.html">Индекс базы данных "Полынь "</А>

где значением атрибута HREF является адрес документа "index.html" на машине "polyn.net.kiae.su", доступ к которой осуществляется по протоколу HTTP. Форма записи этого адреса называется универсальным локатором ресурсов (Universe Resource Locator) и является составной частью технологии WWW.

Содержание элемента A, заключенное между тагом начала и тагом конца элемента, выделяется в тексте цветом, определенным для контекстных гипертекстовых ссылок.

Другой формой использования элемента A является определение точек внутри текста, на которые можно сослаться:

<A NAME="point"></A>

Для ссылки на такую точку используют следующую форму URL:

<A HREF="http://polyn.net.kiae.su/index.html#point">Ссылка на точку "point" в документе "index.html"</A>

В новом стандарте языка возможность атрибута NAME несколько теряется в связи с использованием атрибута ID, который может быть включен во все блочные атрибуты. При написании документов следует учитывать, что NAME реализован во всех интерпретаторах HTML, в то время как ID только в Arena.

Элемент A имеет еще один интересный атрибут - SHAPE. Этот атрибут описывает форму участка графического образа, который можно использовать как гипертекстовую ссылку.

На описании простых гипертекстовых ссылок можно закончить обзор средств языка HTML, ориентированных на текстовое представление информации и организацию гипертекстовых баз данных.


Дата добавления: 2018-04-05; просмотров: 573; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!