Издательство СО РАН

Издательство СО РАН

Адрес Издательства СО РАН: Россия, 630090, а/я 187
Новосибирск, Морской пр., 2

soran2.gif

Baner_Nauka_Sibiri.jpg


Яндекс.Метрика

Array
(
    [SESS_AUTH] => Array
        (
            [POLICY] => Array
                (
                    [SESSION_TIMEOUT] => 24
                    [SESSION_IP_MASK] => 0.0.0.0
                    [MAX_STORE_NUM] => 10
                    [STORE_IP_MASK] => 0.0.0.0
                    [STORE_TIMEOUT] => 525600
                    [CHECKWORD_TIMEOUT] => 525600
                    [PASSWORD_LENGTH] => 6
                    [PASSWORD_UPPERCASE] => N
                    [PASSWORD_LOWERCASE] => N
                    [PASSWORD_DIGITS] => N
                    [PASSWORD_PUNCTUATION] => N
                    [LOGIN_ATTEMPTS] => 0
                    [PASSWORD_REQUIREMENTS] => Пароль должен быть не менее 6 символов длиной.
                )

        )

    [SESS_IP] => 18.224.69.179
    [SESS_TIME] => 1727408666
    [BX_SESSION_SIGN] => 9b3eeb12a31176bf2731c6c072271eb6
    [fixed_session_id] => 8fb37b799cf8061717c4196d569c503f
    [UNIQUE_KEY] => e0cd609263a170141a5757ab1767dd77
    [BX_LOGIN_NEED_CAPTCHA_LOGIN] => Array
        (
            [LOGIN] => 
            [POLICY_ATTEMPTS] => 0
        )

    [SESS_OPERATIONS] => Array
        (
        )

)

Поиск по журналу

Геология и геофизика

Принятые к публикации статьи

ОБОБЩЕННЫЙ МАССИВ ГЕОЛОГО-ГЕОФИЗИЧЕСКОЙ ИНФОРМАЦИИ ВОСТОЧНОГО СЕКТОРА РОССИЙСКОЙ АРКТИКИ ДЛЯ ПРОВЕДЕНИЯ АНАЛИЗА МЕТОДАМИ МАШИННОГО ОБУЧЕНИЯ

И.А. Лисенков1, А.А. Соловьев1,2, В.А. Кузнецов3, Ю. И. Николова1
1Геофизический центр Российской академии наук, Москва,  Россия
2Институт физики Земли им. О. Ю. Шмидта Российской академии наук, Москва,  Россия
3Национальный исследовательский ядерный университет «МИФИ», Москва,  Россия

Ключевые слова: российская Арктика, геофизика, геология, геопространственные данные, машинное обучение, AutoML, ГИС, PostgreSQL, Python, Hadoop

Аннотация

В статье реализован практический подход к сбору и предварительной обработке геолого-геофизических пространственных данных для применения моделей машинного обучения в интересах задач геофизики. Согласно устоявшимся принципам оценки трудозатрат в области анализа данных, которые подтверждаются результатами проводимых опросов среди специалистов, данный этап занимает значительную долю времени и ресурсов, составляющую около 80% от общего объема типового проекта по анализу данных и тестирования гипотез. Основное внимание уделяется формированию согласованного массива данных, объединяющего геологическую и геофизическую информацию в заданном регионе. Рассматриваются особенности учета различий в представлении геоданных, связанные с форматом (вектор/растр), масштабом, типом атрибутивной информации (количественная/качественная) и их доступностью. Важным аспектом является формализация и синтез алгоритма комбинирования геопространственных данных и перевода их в количественные вектора. Для комбинирования данных вводится понятие окрестности для отбора и консолидации информации. В работе представлена общая архитектура программно-аппаратного комплекса, которая включает модуль сбора и преобразования данных на языке Python с использованием библиотеки Pandas, систему хранения данных на базе СУБД PostgreSQL с расширением PostGIS. Показано, что для рассматриваемого класса задач геофизики достаточно использования реляционной СУБД для хранения и обработки данных. При необходимости масштабирования системы, в случае увеличения размерности задачи, предлагается применение технологии работы с большими данными на основе Apache Hadoop. В качестве демонстрации практического применения предложенных подходов приведены результаты сбора данных для региона Кавказского региона и восточного сектора российской Арктики. На основе подготовленных данных проведены эксперименты с использованием моделей машинного обучения по распознаванию мест возможного возникновения сильных землетрясений и оценке ряда геофизических показателей в данных регионах. В статье приводятся результаты проведенных экспериментов и оценки их эффективности.

DOI: 10.15372/GiG2024148