Hive là gì

Yahoo bước đầu làm việc với PIG (đang nói sau) cho các xúc tiến vận dụng của họ bên trên Hadoop. Mục tiêu của Yahoo để làm chủ dữ liệu ko cấu tạo. Tương trường đoản cú, Facebook bước đầu tiến hành các giải pháp kho tài liệu (warehouse) của họ bên trên Hadoop cùng với HIVE. Lý vì chọn cần sử dụng HIVE là cũng chính vì các phương án kho tài liệu (warehouse) truền thống siêu đắc.

Bạn đang xem: Hive là gì

HIVE là gì?


*

Hive là hạ tầng kho dữ liệu mang đến Hadoop. Nhiệm vụ chính là hỗ trợ sự tổng hợp dữ liệu, truy tìm vấn và phân tích. Nó cung cấp phân tích các tập dữ liệu mập được lưu giữ trong HDFS của Hadoop tương tự như trên Amazon S3. Điểm giỏi của HIVE là cung cấp truy hỏi xuất giống như SQL đến dữ liệu gồm kết cấu, biết đến với thương hiệu HiveSQL (hoặc HQL) tương tự như so sánh big data với MapReduce. Hive ko được tạo để trả lời nkhô giòn những câu tầm nã vấn cơ mà nó được desgin cho các áp dụng khai quật tài liệu (data mining). Các vận dụng khai thác dữ liệu rất có thể mất quá nhiều phút mang lại các tiếng nhằm so sánh dữ liệu cùng HIVE được sử dụng đa số.

Cách tổ chức triển khai của HIVE

Dữ liệu được tổ chức thành 3 format vào HIVE.

Tables: Chúng khôn xiết tương tự như nlỗi bảng (tables) vào RDBMS với cất những dòng (rows). Hive sầu chỉ được xếp lớp bên trên HDFS, cho nên vì vậy tables được ánh xạ trực tiếp vào các tlỗi mục của hệ thống tập tin. Nó cũng cung ứng những tables được giữ bên trên những khối hệ thống tập tin khác.

Partitions: Hive tables có thể có khá nhiều hơn 1 partition. Chúng được ánh xạ với những tlỗi mục bé và những hệ thống tập tin.

Xem thêm: Những Stt Nhớ Người Yêu Hay Nhất 0, Stt Nhớ Người Yêu Hay Nhất 0

Buckets: Trong Hive, tài liệu rất có thể được tạo thành các buckets. Buckets được lưu trữ như những tập tin vào partition trong khối hệ thống tập tin.

Hive cũng có thể có metastore nhằm giữ toàn bộ metadata. Nó là CSDL quan hệ chứa công bố không giống nhau liên quan mang lại Hive Schema (column types, owners, key-value data, statistics,…). Chúng ta rất có thể sử dụng MySquốc lộ cho vấn đề này.


*

*

HiveSQL (HQL) là gì?

Ngôn ngữ tầm nã vấn Hive sầu cung ứng những tân oán tử cơ bản tương tự SQL. Đây là một số tác vụ cơ mà HQL có thể làm cho thuận lợi.

Xem thêm: Cách Xào Ốc Móng Tay - Tổng Hợp 10 Thơm Ngon Đậm Đà Đơn Giản Dễ Làm

Tạo và thống trị tables cùng partitions.Hỗ trợ những tân oán tử Relational, Arithmetic và Logical không giống nhau.Evaluate functionsTải về nội dung 1 table tự thỏng mục cục bộ hoặc tác dụng của câu truy vấn mang lại thư mục HDFS.

Đây là ví dụ truy vấn vấn HQL:

SELECT upper(name), salesprice FROM sales; SELECT category, count(1) FROM products GROUP BY category;


Chuyên mục: ĐỊNH NGHĨA