Вторник, 21.05.2024, 02:06
Лучшее что есть для 1С
Приветствую Вас Гость | RSS
Главная Регистрация Вход
Поиск

Меню сайта

Архив записей

Календарь
«  Ноябрь 2010  »
ПнВтСрЧтПтСбВс
1234567
891011121314
15161718192021
22232425262728
2930

Статистика

Онлайн всего: 13
Гостей: 13
Пользователей: 0

Форма входа

Друзья сайта
  • Официальный блог
  • Сообщество uCoz
  • FAQ по системе
  • Инструкции для uCoz

  • Наш опрос
    Оцените мой сайт
    Всего ответов: 10

    Главная » 2010 » Ноябрь » 16 » Google Refine – универсальное средство очистки данных
    10:01
    Google Refine – универсальное средство очистки данных
    Google Refine – универсальное средство очистки данных

    Вышла обновленная версия продукта Google Refine, популярного открытого решения для анализа, очистки и обработки наборов данных из разных источников. Это программное обеспечение, ранее известное под именем Freebase Gridworks, было унаследовано корпорацией Google в результате приобретения компании Metaweb в июле этого года.

    Инструментарий Google Refine может оказаться полезным при необходимости извлечения нужной информации из набора данных, содержащих заведомые неточности. Предлагаемое настольное ПО способно, к примеру, обнаружить все варианты написания выбранного слова в специфическом наборе данных и заменить их на нужный вариант.

    Процесс приведения набора данных в надлежащий вид называется нормализацией и не является революционным открытием. Однако обычно нормализация данных предполагает написание кода для каждого конкретного набора данных. Уникальность продукта Google Refine, написанного на языке Java, заключается в его универсальности. Решение может использоваться с широким спектром наборов данных без написания дополнительного кода.

    В комплект поставки Google Refine входят и другие полезные инструменты, а кроме того, продукт поддерживает собственный язык выражений, который может использоваться для анализа наборов данных. Для отделения подмножеств данных друг от друга могут применяться специальные фильтры.

    Google Refine позволяет обрабатывать документы, состоящие из нескольких сотен тысяч строк, и может использоваться с неформатированными текстовыми файлами, содержимое которых разделено на колонки с использованием запятых. Результаты обработки экспортируются в документ JSON (JavaScript Object Notation), который, в свою очередь, может быть сконвертирован в таблицу HTML или другой популярный формат.

    Вниманию пользователей предлагается возможность связывания доступных записей со сторонними источниками данных, а также целый набор новых команд трансформации и выражений.

    Свежую версию Google Refine 2.0 можно загрузить с сайта производителя.

    Просмотров: 417 | Добавил: NosferatuD | Рейтинг: 0.0/0
    Всего комментариев: 0
    Имя *:
    Email *:
    Код *:
    Copyright MyCorp © 2024 Создать бесплатный сайт с uCoz
    Rambler's Top100