데이터

독서, 강의 기록

빅데이터를 지탱하는 기술 - 챕터 2 : 빅데이터의 탐색

AI, 데이터 분석 등 공부를 하면서 그 어느 것보다 데이터가 중요하다는 것을 깨달은 순간, 데이터를 활용할 수 있는 다양한 기술에 대한 궁금함이 밀려왔다. 조금씩 알아보면서 시중에 있는 다양한 기능의 제품들을 눈동냥했고, 강의나 세미나를 통해서 이들의 활용 사례를 접하면서 이 체계에 대한 정리가 필요함을 느꼈다. 그리하여 빅지기를 정독하며 중요한 내용과 용어 등을 정리해보도록 하겠다. 📖 챕터 2. 빅데이터의 탐색 데이터의 대화적인 집계와 시각화, 데이터 마트의 성질 📗 2-1. 크로스 집계의 기본 📍 트랜잭션 테이블, 크로스 테이블, 피벗 테이블 - '크로스 집계'의 개념 행 방향과 열 방향의 테이블에 숫자가 위치하여 크로스 테이블이라고 한다. 수작업으로 진행시 이 작업은 간단하지만, DB에 새로운 ..

독서, 강의 기록

빅데이터를 지탱하는 기술 - 챕터 1 : 빅데이터의 기초 지식

AI, 데이터 분석 등 공부를 하면서 그 어느 것보다 데이터가 중요하다는 것을 깨달은 순간, 데이터를 활용할 수 있는 다양한 기술에 대한 궁금함이 밀려왔다. 조금씩 알아보면서 시중에 있는 다양한 기능의 제품들을 눈동냥했고, 강의나 세미나를 통해서 이들의 활용 사례를 접하면서 이 체계에 대한 정리가 필요함을 느꼈다. 그리하여 빅지기를 정독하며 중요한 내용과 용어 등을 정리해보도록 하겠다. 📖 이 책의 구성 빅데이터의 기초 지식 : 빅데이터 기술의 역사적 배경과 스몰 데이터 기술을 포함한 기본적인 용어 정리 빅데이터의 탐색 : 데이터의 대화적인 집계와 시각화, 데이터 마트의 성질 빅데이터의 분산 처리 : Hadoop, Spark 등 분산 처리 프레임워크를 사용하여 데이터 마트를 만들어 내는 프로세스 빅데이터..

SQL 문제풀이

[해커랭크 SQL] Aggregation - Weather Observation Station 19

❓ Question https://www.hackerrank.com/challenges/weather-observation-station-19 Weather Observation Station 19 | HackerRank Query the Euclidean Distance between two points and round to 4 decimal digits. www.hackerrank.com ❗ Answer SELECT ROUND(POW(POW(MAX(lat_n)-MIN(lat_n),2) + POW(MAX(long_w)-MIN(long_w),2),0.5),4) FROM station; 📌 Discussion 유클리디안 거리는 x축 거리 제곱과 y축 거리 제곱의 합의 제곱근이다. POW로 제곱과 제곱근을..

SQL 문제풀이

[해커랭크 SQL] Aggregation - Weather Observation Station 18

❓ Question https://www.hackerrank.com/challenges/weather-observation-station-18 Weather Observation Station 18 | HackerRank Query the Manhattan Distance between two points, round or truncate to 4 decimal digits. www.hackerrank.com ❗ Answer SELECT ROUND((MAX(lat_n)-MIN(lat_n)+MAX(long_w)-MIN(long_w)),4) FROM station; 📌 Discussion 맨하탄 거리는 x축 거리와 y축 거리의 합이다. 따라서 lat_n과 long_w 각각의 최대값과 최소값의 차이를 더해준다.

SQL 문제풀이

[해커랭크 SQL] Aggregation - Weather Observation Station 17

❓ Question https://www.hackerrank.com/challenges/weather-observation-station-17 Weather Observation Station 17 | HackerRank Query the Western Longitude for the smallest value of the Northern Latitudes greater than 38.7780 in STATION and round to 4 decimal places. www.hackerrank.com ❗ Answer SELECT ROUND(long_w,4) FROM station WHERE lat_n = (SELECT MIN(lat_n) FROM station WHERE lat_n > 38.7780); ..

SQL 문제풀이

[해커랭크 SQL] Aggregation - Weather Observation Station 16

❓ Question https://www.hackerrank.com/challenges/weather-observation-station-16 Weather Observation Station 16 | HackerRank Query the smallest of STATION's Northern Latitudes that is greater than 38.7780, and round to 4 decimal places www.hackerrank.com ❗ Answer SELECT ROUND(MIN(lat_n),4) FROM station WHERE lat_n > 38.7780; 📌 Discussion WHERE 절에서 조건을 걸고 최소값에 반올림하여 레코드 추출

SQL 문제풀이

[해커랭크 SQL] Aggregation - Weather Observation Station 15

❓ Question https://www.hackerrank.com/challenges/weather-observation-station-15 Weather Observation Station 15 | HackerRank Query the Western Longitude for the largest Northern Latitude under 137.2345, rounded to 4 decimal places. www.hackerrank.com ❗ Answer SELECT ROUND(long_w,4) FROM station WHERE lat_n = (SELECT MAX(lat_n) FROM station WHERE lat_n < 137.2345); 📌 Discussion sub query scalar로 W..

SQL 문제풀이

[해커랭크 SQL] Aggregation - Weather Observation Station 14

❓ Question https://www.hackerrank.com/challenges/weather-observation-station-14 Weather Observation Station 14 | HackerRank Query the greatest value of the Northern Latitudes from STATION that are under 137.2345 and truncated to 4 decimal places. www.hackerrank.com ❗ Answer SELECT ROUND(MAX(lat_n),4) FROM station WHERE lat_n < 137.2345; 📌 Discussion WHERE 절에서 조건을 주고 MAX값을 추출 후 ROUND로 반올림

냄비짱
'데이터' 태그의 글 목록