Аналитика новостей

Автор Andrey Rodionov, 26.12.2016 22:27:58

« назад - далее »

0 Пользователи и 1 гость просматривают эту тему.

Andrey Rodionov

Всем привет!

Я хотел бы рассказать о своем проекте по анализу новостей космонавтики: https://0space.ru

Новости добавляются вручную. В основном новости берутся с tass.ru и http://www.roscosmos.ru.

Как думаете взлетит?

Безумный Шляпник

ЦитироватьAndrey Rodionov пишет:
Я хотел бы рассказать...
Так расскажите.

Andrey Rodionov

ЦитироватьБезумный Шляпник пишет:
ЦитироватьAndrey Rodionov пишет:
Я хотел бы рассказать...
Так расскажите.
1. Из каждой новости извлекаются факты вида: <кто> <что сделал> <что>. Например: ИЗМИРАН разработчик Парусный спутник.
2. При этом можно быстро искать по связным новостям, если кликнуть на <кто> или <что>.
3. Факты могут составлять часть "проекта". У каждого проекта есть начало, конец и разработчик.
4. Проект может состоять из других проектов. https://ru.wikipedia.org/wiki/Диаграмма_Гантта

Безумный Шляпник

Ну то есть это получается как бы база неких тегов с привязкой к линкам на исходные новостные сообщения. Задумка в целом неплохая.

Безумный Шляпник

А как вы собираетесь ориентироваться в море этих <кто> и <что> по мере разрастания базы? Их же будет огромное количество.

Andrey Rodionov

ЦитироватьБезумный Шляпник пишет:
А как вы собираетесь ориентироваться в море этих <кто> и <что> по мере разрастания базы? Их же будет огромное количество.
Еще не придумал :)

Вообще у каждой сущности <кто> будут свойства (опять же взяты из новостей) так что должно быть просто. 

Lanista

Вы бы не ограничивались только новостями Роскосмоса...
А так да, кликаешь на Рагозина и смотришь обещалки за все года =)

Andrey Rodionov

ЦитироватьLanista пишет:
Вы бы не ограничивались только новостями Роскосмоса...
А так да, кликаешь на Рагозина и смотришь обещалки за все года =)
А какие есть еще источники новостей? 

Я анализирую:
tass.ru
izvestia.ru
zakupki.gov.ru
rbk
roscosmos.ru
energia.ru

Дмитрий Виницкий

А можно тут пример вашего анализа?
+35797748398


Юрий Темников

#10
В этой аналитике нет пожалуй самого главного: практически все эти зеленые топлива (унитарные)-взрывчатые вещества,которые могут сдетонировать в любой момент.Мало вам "Курска??Да и УИ весьма посредственный И способы получения сложноваты.(относительно конечно).Неужели есть желающие летать на бомбе?
Вначале было СЛОВО!И Такое......что все галактики покраснели и разбежались.

Andrey Rodionov

ЦитироватьЮрий Темников пишет:
В этой аналитике нет пожалуй самого главного: практически все эти зеленые топлива (унитарные)-взрывчатые вещества,которые могут сдетонировать в любой момент.Мало вам "Курска??Да и УИ весьма посредственный И способы получения сложноваты.(относительно конечно).Неужели есть желающие летать на бомбе?
Это анализ новостей, а не анализ объекта новости. Как раз этот сайт и должен помочь в анализе топлива, сроков, целей и пр. В голове очень сложно держать множество фактов.

Вот например, Вы против зеленого топлива. Если бы в новости был указан его состав, то можно было бы легко по этому составу найти другие такие же эксперименты и от этих экспериментов посмотреть когда и что взрывалось с официальными комментариями и источниками. А пока это лишь безосновательный наезд.

Юрий Темников

#12
ЦитироватьAndrey Rodionov пишет:
Это анализ новостей, а не анализ объекта новости. Как раз этот сайт и должен помочь в анализе топлива, сроков, целей и пр. В голове очень сложно держать множество фактов.
Есть такая книжка,старая,Слово о ракетном топливе.Можете процитировать главу оттуда об унитарных топливах.Но я не о том.Такой многофакторный анализ попросту невозможен.Каждый день гигабайты новой информации.Вы просто забьете огромными портянками весь форум и в них наверняка еще труднее будет найти искомое.Но как говаривал Лаврентий Палыч: попытка не  пытка.Дерзайте!
Вначале было СЛОВО!И Такое......что все галактики покраснели и разбежались.

triage

#13
ЦитироватьAndrey Rodionov пишет:
ЦитироватьLanista пишет:
Вы бы не ограничивались только новостями Роскосмоса...
А так да, кликаешь на Рагозина и смотришь обещалки за все года =)
А какие есть еще источники новостей?

Я анализирую:
tass.ru
izvestia.ru
zakupki.gov.ru
rbk
roscosmos.ru
energia.ru
 https://rns.online/ еще иногда публикует отличное от названных источников

Но вот смотрю я на это
Спутник "Лыбидь"
Спутник "Лыбидь" запуск 31-12-2017
30 дек 2016 09:25
Спутник "Лыбидь" разгонный блок Фрегат-СБ
30 дек 2016 06:25
Даже не указаны источники (сайт и кто говорил)
И на это 
Цитировать http://tass.ru/kosmos/3918399
30 декабря, 16:01 дата обновления: 30 декабря, 17:08
...
Запуск украинского спутника "Лыбидь" планируется осуществить с помощью ракеты-носителя "Зенит" в конце 2017 года - начале 2018 года с космодрома Байконур.
"Конец 2017 года (или 2018 год) - "Лыбидь". Ракета - "Зенит-3SLБФ", разгонный блок - "Фрегат-СБ", - говорится в сообщении.
..
Разночтение....

Я бы делал сохранение полной статьи на сайте с ссылкой на источник... или на сохраненную копию... но проблема с авторскими правами.
И эту полную статью парсил на теги. Похожий русскоязычный проект кажется есть.

Andrey Rodionov

Цитироватьpnetmon пишет:
ЦитироватьAndrey Rodionov пишет:
ЦитироватьLanista пишет:
Вы бы не ограничивались только новостями Роскосмоса...
А так да, кликаешь на Рагозина и смотришь обещалки за все года =)
А какие есть еще источники новостей?

Я анализирую:
tass.ru
izvestia.ru
zakupki.gov.ru
rbk
roscosmos.ru
energia.ru
https://rns.online/ еще иногда публикует отличное от названных источников

Но вот смотрю я на это
 Спутник "Лыбидь"
Спутник "Лыбидь" запуск 31-12-2017
30 дек 2016 09:25
Спутник "Лыбидь" разгонный блок Фрегат-СБ
30 дек 2016 06:25
Даже не указаны источники (сайт и кто говорил)
И на это
Цитироватьhttp://tass.ru/kosmos/3918399
30 декабря, 16:01 дата обновления: 30 декабря, 17:08
...
Запуск украинского спутника "Лыбидь" планируется осуществить с помощью ракеты-носителя "Зенит" в конце 2017 года - начале 2018 года с космодрома Байконур.
"Конец 2017 года (или 2018 год) - "Лыбидь". Ракета - "Зенит-3SLБФ", разгонный блок - "Фрегат-СБ", - говорится в сообщении.
..
Разночтение....

Я бы делал сохранение полной статьи на сайте с ссылкой на источник... или на сохраненную копию... но проблема с авторскими правами.
И эту полную статью парсил на теги. Похожий русскоязычный проект кажется есть.
Немного по порядку:

1) Если навести мышкой на новость, то справа будет значок ссылки на источник. Я подумал что если всегда отображать ссылку на источник то будет слишком много информации. Опять же если источник уже разобран на факты то смотреть на него не особо интересно. Разве что для уточнения информации.
2) Разночтение всегда будет, потому что разные люди могут говорить разные вещи. Опять же людям свойственно забывать поэтому иногда они говорят стоимость 300млрд а иногда 275млрд. Кстати когда видно разночтения, то это как раз тот случай ради чего весь проект затевался! Можно очень быстро анализировать странности и разночтения.
3) Факты могут меняться. Например обещания: "запуск" https://0space.ru/entity?name=Спутник+%22Лыбидь%22

А как википедия сохраняет источник? У них нет проблем с лицензиями?

triage

#15
Если навести мышкой на новость, то справа будет значок ссылки на источник - не информативно, и не все и заметят появлющийся в другом углу значек.
Я подумал что если всегда отображать ссылку на источник то будет слишком много информации - видно, не обязательно в тексте давать полный путь, можно и название источника
Разночтение всегда будет, потому что разные люди могут говорить разные вещи - как видно в источнике ТАСС непонятно кто говорит (слова которые говорил Комаров написаны выше, а эти без прямой привязки) про начало 2018 года или вообще в 2018 году, а вас 31.12.2017... разночтения уже на этапе работы с источником

А как википедия сохраняет источник? У них нет проблем с лицензиями? - в вики не вносятся полностью статьи, а я говорил про полные статьи. Для статей в вики на случай удаления источников частично используется https://archive.org/web/ - но смотря ... (блокировки этого сайта archive.org, а так же запрета создания архивных копий некоторых сайтов, и желание отделения ру сегмента сети от всего интернета), непонятно что и советовать, кроме как в локальную базу.

Про русскоязычный аналог - http://ecoruspace.me/

Andrey Rodionov

Цитироватьpnetmon пишет:
Если навести мышкой на новость, то справа будет значок ссылки на источник - не информативно, и не все и заметят появлющийся в другом углу значек.
 Я подумал что если всегда отображать ссылку на источник то будет слишком много информации - видно, не обязательно в тексте давать полный путь, можно и название источника
 Разночтение всегда будет, потому что разные люди могут говорить разные вещи - как видно в источнике ТАСС непонятно кто говорит (слова которые говорил Комаров написаны выше, а эти без прямой привязки) про начало 2018 года или вообще в 2018 году, а вас 31.12.2017... разночтения уже на этапе работы с источником

 А как википедия сохраняет источник? У них нет проблем с лицензиями? - в вики не вносятся полностью статьи, а я говорил про полные статьи. Для статей в вики на случай удаления источников частично используется https://archive.org/web/ - но смотря ... (блокировки этого сайта archive.org, а так же запрета создания архивных копий некоторых сайтов, и желание отделения ру сегмента сети от всего интернета), непонятно что и советовать, кроме как в локальную базу.

Про русскоязычный аналог - http://ecoruspace.me/
Да, с новостями в которых приближенные цифры непонятно что делать. Можно вообще игнорировать, а можно давать приблизительную оценку. Я просто беру 01-01-2018. 

http://ecoruspace.me/ - очень классный сайт! Он правда больше похож на википедию.