RU
Каталог

Дипломная работа(ВКР) на С#. Анализ тональности текста.

Продаж: 0
Возвратов: 0

Загружен: 14.08.2015
Содержимое: ВКР.rar (9848,56 Кбайт)

Продавец

FixFever информация о продавце и его товарах
offlineЗадать вопрос

За положительный отзыв о купленном товаре продавец предоставит вам подарочную карту на сумму 316,51 руб..

Описание товара

Выпускная Квалификационная Работа на тему: "Разработка программных средств анализа тональности текстов на основе методов машинного обучения". Выполнено в 2015 году, защищено на "отлично" без каких либо замечаний. Сделана работа аккуратно и продумано. Программы реализованы в Visual Studio 2013 на языке C#. Оригинальность пояснительной записки(113 стр) по antiplagiat.ru - 84%. Объем и обширность работы (по словам заведующего кафедры) подходит как для защиты работы для бакалавриата, так и специалитета и даже магистратуры.

Фрагмент введения:
С развитием интернет-сервисов каждый пользователь получил в числе прочих возможность выражать свое мнение. Это может быть мнение относительно товара или услуги, фильма или книги, компании или политического деятеля. Таким образом возникла потребность обрабатывать огромные объемы информации для определения отношения пользователей к тому или иному объекту.
Очевидно, что количество отзывов публикуемых, например, в социальных сетях достигает десятков тысяч, и обработка отзывов вручную экспертами оказывается невозможной. В связи с этим широкое распространение получили такие области Computer Science, как Opinion Mining и Sentiment Analysis (от английского sentiment – чувство). Благодаря анализу тональности стало возможным автоматически получить или «извлечь» мнение, выраженное в тексте.
Анализ тональности текста (сентимент-анализ) – область компьютерной лингвистики, занимающаяся выделением из текстов эмоционально окрашенной лексики или эмоциональной оценки автора.
Анализ тональности текстов – сложная задача, т.к. требует глубокого знания явных и неявных, часто используемых и редких, синтаксических и семантических правил естественного языка. Исследователи в данной области сталкиваются с нерешенными проблемами из области обработки текстов на естественном языке такими как: разрешение различных неоднозначностей, обработка отрицания в текстах и др.
К задачам анализа тональности относятся:
• классификация документов на основе мнений;
• классификация предложений на основе мнений;
• анализ мнений на основе характеристик объекта;
• создание словаря мнений;
• поиск сравнений;
• поиск спама в отзывах;
• анализ полезности отзывов.
Проблема анализа мнений интернет-пользователей становится все более важной как с теоретической, так и с прикладной точек зрения. Сентимент-анализ привлекает крупные компании в связи со значительным распространением социальных медиа, ведь маркетологам всегда было необходимо мониторить СМИ в поисках упоминаний своих брендов.
Различные предметные области, типы и категории текстов требуют отдельного внимания. Не существует универсального алгоритма анализа тональности, который бы показывал достаточный уровень точности классификации в любой предметной области и категории текстов. В предлагаемой работе рассматривается не только задача анализировать тональность текстов, но и также проводится анализ и сравнение различных методов и подходов к классификации тональности текстов.
Актуальность данной темы состоит в том, что задача сентимент-анализа возникла сравнительно недавно и оптимального решения проблемы на данный момент не существует. Следует принять во внимание так же и то, что все задачи, так или иначе связанные с обработкой естественных языков – сложны и неоднозначны. Это в первую очередь касается методов машинного перевода, распознавания речи, а также сентимент-анализа. По этой причине, исследований в этой области не очень много, а русскоязычных работ практически нет.
Целью данной работы является реализация программного обеспечения, предназначенного для анализа тональности текстов на русском языке и анализа эффективности различных методов и подходов к анализу тональности текстов.

Дополнительная информация

В архиве(Пароль - Ryesd234@31#121):
1. Пояснительная записка (116 стр)
2. Аннотация
3. Отзыв от науч. рук.
4. Отчет антиплагиата
5. Презентация (20 слайдов)
6. Речь к презентации
7. Исходные коды программ (Проекты Visual Studio)
8. Данные для программ

Содержание пояснительной записки:
Введение 8
1 Исследовательский раздел11
1.1 Цели и задачи анализа тональности текстов 11
1.1.1 Определение 11
1.1.2 Цели и применение анализа тональности 11
1.1.3 Проблематика в задаче определения тональности 14
1.2 Обзор видов классификации текстов 15
1.2.1 Классификация по бинарной шкале 15
1.2.2 Многоклассовая классификация 15
1.2.3 Регрессия 16
1.2.4 Субъективность/объективность 17
1.3 Обзор подходов к анализу тональности текстов 17
1.3.1 Подходы, основанные на наборах правил 18
1.3.2 Подходы, основанные на словарях тональностей 19
1.3.3 Машинное обучение 20
1.3.3.1 Машинное обучение с учителем 21
1.3.3.2 Машинное обучение без учителя 21
1.4 Обзор математических методов классификации в области машинного обучения с учителем 22
1.4.1 Метод ближайших соседей 22
1.4.2 Наивный Байесовский классификатор 22
1.4.3 Метод опорных векторов 23
1.4.4 Метод решающего дерева 25
1.5 Обзор методов организации вектора признаков 25
1.5.1 Получение корпуса текстов 25
1.5.2 Предварительная обработка текста 28
1.5.3 Вектор признаков 29
1.5.3.1 N-граммы 29
1.5.3.2 Символьные N-граммы 30
1.5.4 Взвешенный вектор 31
1.5.4.1 Бинарный вес 31
1.5.4.2 TF-IDF 31
1.5.4.3 dTF-IDF 31
1.6 Обзор программных решений в области анализа тональности текста на русском языке 32
1.6.1 «SentiStrength» 32
1.6.2 Модуль анализа тональности текста в системе «Аналитический курьер» 33
1.6.3 Модуль анализа тональности текстов в системе RCO Fact Extractor 34
Выводы 34
2 Специальный раздел 36
2.1 Формальное описание предметной области 36
2.1.1 Задача классификации текстов и машинного обучения 36
2.1.2 Задача анализа тональности текста 37
2.2 Разработка архитектуры системы анализа тональности текста 38
2.2.1 Алгоритм анализа тональности текста 38
2.2.2 Алгоритм анализа эффективности различных методов классификации 41
2.3 Организация вектора признаков 43
2.3.1 Признаковое описание текста 43
2.3.2 Взвешенный вектор 44
2.3.2.1 Бинарный вес 45
2.3.2.2 dTF-IDF 45
2.3.2.3 Модифицированный dTF-IDF 45
2.4 Методы машинного обучения с учителем в области классификации 47
2.4.1 Наивный Байесовский классификатор (NB)47
2.4.2 Метод опорных векторов (SVM)50
2.5 Метод оценки точности классификатора51
2.5.1 Метрика правильности и ошибочности52
2.5.2 Точность и полнота52
2.5.3 F1-мера53
Выводы 54
3 Технологический раздел55
3.1 Выбор программных средств55
3.2 Разработка архитектуры ПО57
3.3 Разработка парсера данных из сети интернет58
3.3.1 Выбор пользователем тональности рецензий59
3.3.2 Выбор количества рецензий60
3.3.3 Выбор начальной позиции60
3.3.4 Парсинг и предобработка рецензий60
3.3.5 Сохранение коллекции текстов61
3.4 Реализация алгоритмов организации вектора признаков61
3.5 Реализация алгоритмов обучения классификатора63
3.5.1 Обучение Наивного Байесовского Классификатора63
3.5.2 Обучение классификатора по методу опорных векторов64
3.5.2.1 Обучение SVM-классификатора с бинарной функцией взвешивания65
3.5.2.2 Обучение SVM-классификатора с функцией dTF-IDF6
3.5.2.3 Обучение SVM-классификатора с функцией Mod dTF-IDF67
3.5.3 Сохранение модели классификатора68
3.6 Реализация алгоритмов классификации текстов68
3.6.1 Алгоритм NB-классификации68
3.6.2 Алгоритм SVM-классификации69
3.7 Анализ точности классификации текстов70
Выводы75
4 Другие разделы проекта77
4.1 Руководство пользователя77
4.1.1 Парсер рецензий ParserKinopoisk.exe77
4.1.2 Основная программа Sentiment.exe78
4.2 Руководство программиста82
4.3 Руководство системного администратора83
5 Заключение85
Список использованных источников87
Приложения 88

Пароль от архива - Ryesd234@31#121

Отзывы

0
Отзывов от покупателей не поступало.
За последние
1 мес 3 мес 12 мес
0 0 0
0 0 0
За положительный отзыв о купленном товаре продавец предоставит вам подарочную карту на сумму 316,51 руб..
В целях противодействия нарушению авторских прав и права собственности, а также исключения необоснованных обвинений в адрес администрации сайта о пособничестве такому нарушению, администрация торговой площадки Plati (http://www.plati.com) обращается к Вам с просьбой - в случае обнаружения нарушений на торговой площадке Plati, незамедлительно информировать нас по адресу support@plati.com о факте такого нарушения и предоставить нам достоверную информацию, подтверждающую Ваши авторские права или права собственности. В письме обязательно укажите ваши контактные реквизиты (Ф.И.О., телефон).

В целях исключения необоснованных и заведомо ложных сообщений о фактах нарушения указанных прав, администрация будет отказывать в предоставлении услуг на торговой площадке Plati, только после получения от Вас письменных заявлений о нарушении с приложением копий документов, подтверждающих ваши авторские права или права собственности, по адресу: 123007, г. Москва, Малый Калужский пер. д.4, стр.3, Адвокатский кабинет «АКАР №380».

В целях оперативного реагирования на нарушения Ваших прав и необходимости блокировки действий недобросовестных продавцов, Plati просит Вас направить заверенную телеграмму, которая будет являться основанием для блокировки действий продавца, указанная телеграмма должна содержать указание: вида нарушенных прав, подтверждения ваших прав и ваши контактные данные (организиционно-правовую форму лица, Ф.И.О.). Блокировка будет снята по истечение 15 дней, в случае непредставления Вами в Адвокатский кабинет письменных документов подтверждающих ваши авторские права или права собственности.

Партнерам: 5 $ — как заработать
Оплатить с помощью:
с "Правилами покупки товаров" ознакомлен и согласен