Вахромеева Е.Н., Зензинова Ю.Б. Автоматизация кластеризации компаний по финансовым показателям с использованием k-means алгоритма на больших данных
Ключевые слова:
Кластеризация, K-means, финансовые показатели, анализ данных, Python, генерация данных, визуализацияАннотация
В данной статье рассматривается использование алгоритма K-means на Python для кластеризации компаний на основе их финансовых показателей. Для демонстрации метода были сгенерированы синтетические данные, включающие чистую прибыль, общие активы и доход компаний. Описаны этапы предварительной обработки данных, нормализации и выполнения кластерного анализа. Приведена визуализация результатов кластеризации. Приведены преимущества использования языка Python и его библиотек для анализа данных, включая обработку больших объемов данных, масштабируемость и автоматизацию. Кластерный анализ позволяет выявлять группы компаний со схожими экономическими характеристиками, что может способствовать более точной сегментации рынка и разработке таргетированных стратегий. Данный подход позволяет эффективно анализировать большие объемы финансовых данных и выявлять скрытые закономерности, что может быть полезным для аналитиков и инвесторов.
Скачивания
Опубликован
Как цитировать
Выпуск
Раздел
Категории
Лицензия
Copyright (c) 2024 admin admin
Это произведение доступно по лицензии Creative Commons «Attribution-NonCommercial-NoDerivatives» («Атрибуция — Некоммерческое использование — Без производных произведений») 4.0 Всемирная.
Авторы, публикующие произведения в журнале «Дискуссия», соглашаются со следующими условиями:
- Авторы сохраняют за собой авторское право и предоставляют журналу право первой публикации произведения, одновременно лицензированной в соответствии с лицензией Creative Commons Attribution, позволяющей другим лицам пользоваться произведением с подтверждением авторства и первоначальной публикации в журнале «Дискуссия».
- Авторы вправе заключать с иными лицами лицензионные договоры на условиях простой (неисключительной) лицензии на использование опубликованного в журнале «Дискуссия» произведения (например, размещение его в базах данных университетов, публикация в книге), со ссылкой на его оригинальную публикацию в этом журнале.
- Автор гарантирует, что является правообладателем всех материалов, предоставляемых в редакцию, и что исключительные права на данные материалы не переданы или не предоставлены другим лицам.
- Авторам разрешено и рекомендуется размещать свое произведение в Интернете до и во время процесса подачи, поскольку это может привести к продуктивному обмену, а также к более раннему и более широкому цитированию опубликованных работ.
С момента загрузки произведения и сопроводительных материалов через раздел "Отправка материалов", автор полностью и безоговорочно принимает (акцептует) публичную оферту о заключении авторского соглашения об опубликовании произведения. В соотвтетствии с этим соглашением автор предоставляет издателю на безвозмездной основе неисключительную лицензию на использование созданного автором произведения.
С момента получения произведения и прилагаемых к нему материалов журнал "Дискуссия" вправе использовать полученные произведения без ограничений по своему усмотрению и в пределах всего срока действия исключительных прав, но с обязательным указанием имени автора (авторов) произведения, в том числе публиковать произведения (полностью или в сокращении) на территории всего мира, переводить на другие языки, направлять в репозитории научной информации, размещать в сети Интернет и использовать другими законными способами.