ABC Chemistry logo ABC Chemistry / ИТ в химии : Практикум. Ч. 2. : Оглавление / 2. Структурный поиск. Формирование запроса с помощью апплета

2. Структурный поиск. Формирование запроса с помощью апплета




Минилекция: Молекулярное (химическое) подобие





Структурный поиск

Во многих базах данных, содержащих сведения о химических структурах, имеется возможность вести информационный поиск, используя в качестве запроса двумерную структурную формулу.

В таких базах данных можно встретить три варианта действий поисковой программы; обычно пользователь сам выбирает нужный ему вариант из имеющегося набора.

1. Поиск по структуре - Structure (Exact) Search.
Поисковая программа ищет структуры, полностью совпадающие со структурой запроса.

2. Поиск по подструктуре (субструктуре) - Подструктурный (субструктурный) поиск - Substructure Search.
Поисковая программа ищет структуры, в остовах которых есть участок, целиком совпадающий с остовом запроса.

3. Поиск по подобию - Similarity Search.
Поисковая программа ищет структуры, в которых имеются такие же структурные фрагменты, какие есть в запросе.
На поисковом бланке обычно можно задать минимально допустимую степень соответствия, в %.
Для расчета степени соответствия часто используется коэффициент Танимото.

Контрольное задание.




Апплет

Апплет — это маленькая исполняемая программа, которая загружается вместе с веб-страницей.

Рассмотрим апплеты, предназначенные для создания двумерных химических структур. С помощью таких апплетов конструируют запросы в тех базах данных, где возможен поиск по структурной формуле.

Приемы работы с апплетом весьма схожи с приемами работы с "большим" молекулярным редактором, таким как ISIS/Draw — только намного проще.
Основная задача апплета — правильно отобразить молекулярный граф, на основании которого должен проводиться поиск. Красота формируемого изображения не имеет никакого значения в поисковом процессе, поэтому у таких апплетов нередко отсутствуют дизайнерские функции (выравнивание длин связей, валентных углов, поворот в плоскости листа и т. п.).
Инструментарий апплета как правило ограничивается управляющими командами (стереть, выделить) и кнопками химических символов (главным образом "органического" набора), химических связей (главным образом не отражающих симметрию), простейших структурных фрагментов (например, циклов).

Стандартизация в работе различных апплетов отсутствует, но приемы работы просты настолько, что при минимуме навыков они оказываются интуитивно понятными.




Апплет NIST Molecular Editor

NIST Chemistry WebBook
http://webbook.nist.gov/chemistry/

-- это один из авторитетнейших онлайновых источников термодинамической, спектроскопической и структурной информации.

Запрос для информационного поиска в NIST Chemistry WebBook может быть сформирован несколькими способами. Рассмотрим, как для этих целей применяется апплет.

С Главной страницы NIST Chemistry WebBook к нужному бланку следует перейти по цепочке ссылок:

Structure (в группе ссылок Search Options / General Searches) >> Use applet to draw a structure.

Самостоятельная работа.

Ознакомьтесь с приемами формирования запроса для структурного поиска.
Выполните тренировочные упражнения и контрольные задания.

Краткая инструкция и контрольные задания.




Апплет JS Draw

Функциональные возможности JS Draw рассмотрим в каталоге реактивов компании Sigma-Aldrich.

Перейдите к поисковому бланку с апплетом по ссылке Structure Search.

Самостоятельная работа.

Ознакомьтесь с приемами формирования запроса для структурного поиска.
Выполните тренировочные упражнения и контрольные задания.

Краткая инструкция и контрольные задания.




Апплет Marvin JS

Функциональные возможности Marvin JS рассмотрим на примере работы поискового бланка химической поисковой системы SureChEMBL.

SureChEMBL - поисковая система нового типа. Она предназначена для обнаружения химически значимой информации, причем запрос здесь можно составить в виде структурной формулы.

Самостоятельная работа и контрольное задание.

На сайте SureChEMBL методом проб и ошибок изучите функциональные возможности апплета Marvin JS.
Далее мы извлечем патент, в тексте которого упоминается дифосфат платины(IV), и проанализируем особенности строения этого патентного документа.

1. Сформируйте структурный запрос - в окошке апплета изобразите структурную формулу дифосфат-иона - и проведите субструктурный поиск.
Подсказка: кнопки изменения заряда атома (+ и -) находятся на левой панели управления апплета.

2. В списке результатов поиска найдите дифосфат платины(IV), щелкните по знаку "плюс" и перейдите по ссылке View chemical page.

3. На открывшейся странице перейдите на закладку Patent hits.

4. Выведите на экран текст любого из патентов, имеющихся в полученном списке.
Найдите такие особенности текста, которые явно отсутствовали бы в патенте, извлекаемом из обычной патентной базы данных (USPTO, espacenet и т. п.).

Перед вами семантически обогащенный документ.
Возможно, подобным образом будут конструироваться все научные документы в будущем - когда на смену нынешнему вебу придет Web 3.0.

Извлеченный патент предъявите преподавателю.
Укажите те элементы, которые здесь используются для обогащения исходного текста химической информацией.



А.А. Рагойша
Белорусский государственный университет
2010-2017