Please use this identifier to cite or link to this item:
Other Titles: Организация Больших данных в распределенной среде
Big data organizing in a distributed environment
Authors: Шаховська, Н.Б.
Болюбаш, Ю.Я.
Верес, О.М.
Shakhovska, N.B.
Bolubash, Yu.Ya.
Veres, O.M.
Keywords: великі дані
інформаційний продукт
простір даних
большие данные
информационный продукт
пространство данных
big data
information products
data space
Issue Date: Jun-2014
Publisher: ДонНТУ
Citation: Наукові праці Донецького національного технічного університету. Серія: Обчислювальна техніка та автоматизація. Випуск 2(27). - Донецьк: ДонНТУ, 2014. - 229 с
Series/Report no.: Наукові праці Донецького національного технічного університету. Серія: Обчислювальна техніка та автоматизація. Випуск 2(27). - Донецьк: ДонНТУ, 2014. - С. 147-155.;
Abstract: У статті уведено поняття терміну Великі дані та проаналізовано причину їх появи. Визначено причини використання NoSQL та інших нереляційних засобів зберігання даних. Описано простір даних як технологію роботи з Великими даними. В статье введено понятие срока Большие данные и проанализированы причины их появления. Подано информационную модель федеративного хранилища данных и описаны его составные элементы. Определены особенности использования NoSQL и других нереляционных средств хранения данных. Описано пространство данных как технология работы с Большими данными. Описаны уровни физической модели пространства данных.
Description: This paper introduced the concept of the term Big Data and analyzes the cause of its appearance. Big Data is a set of methods and tools for processing different types of structured and unstructured data in large amounts for their analysis and use of decision support. There is an alternative to traditional database management systems and solutions of Business Intelligence class. To this class belong the parallel data processing means (NoSQL, algorithms MapReduce, Hadoop). Defining characteristic for Big data is the amount (volume, in terms of volume size ), speed (velocity in terms of both growth rate and the need for high-speed processing and the results), diversity (variety, in terms of the possibility of simultaneous processing of different types of structured and semi-structured data). One of the technologies that should be used for large data region is the data space available. Data space is a block vector containing a set of information products divided into three categories: structured data (databases, data warehouses), semi-structured data (XML, spreadsheets) and unstructured data (text). Above this vector and its individual elements there are defined operations and predicates. A federated information model is posted that describes the data warehouse and its components. The features of non-relational NoSQL and other means of storage are described. We describe the data space as the technology of working with large data. The levels of physical model data space are given.
ISSN: 2075-4272
Appears in Collections:Випуск 2(27)

Files in This Item:
File Description SizeFormat 
Shakhovska.PDF1,52 MBAdobe PDFView/Open

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.