Join두 개 이상의 테이블에서 관련 있는 데이터를 결합 1) Inner Join두 테이블의 교집합즉, 두 테이블의 Join 조건에 일치하는 행만 반환SELECT * FROM table1INNER JOIN table2ON table1.matching_column = table2.matching_column; 2) Left (Outer) Join첫 번째 테이블의 모든 행과 두 번째 테이블에서 일치하는 행을 반환일치하지 않는 경우, 두 번째 테이블의 값은 NULL로 반환SELECT * FROM table1LEFT JOIN table2ON table1.matching_column = table2.matching_column; 3) Right (Outer) Join두 번째 테이블의 모든 행과 첫 번째 테이블에서..
에러문 django.core.exceptions.ImproperlyConfigured: Requested setting INSTALLED_APPS, but settings are not configured. You must either define the environment variable DJANGO_SETTINGS_MODULE or call settings.configure() before accessing settings. 에러문 이유 Django는 기본적으로 DJANGO_SETTINGS_MODULE 환경 변수를 통해 설정을 로드한다. 이 환경 변수가 설정되지 않으면 Django는 프로젝트 설정을 찾을 수 없으므로 위와 같은 ImproperlyConfigured 예외가 발생한다. startapp ..
클러스터여러 개의 노드로 구성된 하나의 분산 시스템을 의미하며, 각 노드에는 CPU, 메모리, 스토리지 등의 컴퓨팅 리소스가 있어 데이터 처리와 분석 작업을 병렬로 수행할 수 있다. 관계형 데이터베이스 사용자 / 세션1) 사용자 ID(User ID):- 사용자 ID는 데이터베이스에 저장된 각 사용자를 고유하게 식별하는 식별자(일반적으로 사용자 계정, 프로필, 인증 정보와 연관)- 사용자 ID는 데이터베이스의 다른 테이블에도 참조될 수 있으며, 이를 통해 사용자 관련 데이터를 연결하고 추적할 수 있다.2) 세션 ID(Session ID):- 세션 ID는 사용자가 웹 사이트나 애플리케이션을 사용하는 동안 지속되는 인터랙션을 식별하기 위한 고유한 식별자- 사용자가 로그인하거나 웹 사이트를 방문할 때, 서버는 ..
데이터 웨어하우스란(Data Warehouse)?조직이나 기업에서 다양한 출처의 데이터를 통합, 저장하고 분석할 수 있도록 구성된 대규모 데이터 저장소이다.데이터 웨어하우스는 데이터 마이닝, 비즈니스 인텔리전스(BI), 리포팅, 분석 등의 목적으로 사용되며, 이를 통해 의사결정에 도움을 주는 인사이트를 얻을 수 있다. 1) 주요 특징- 데이터 통합: 다양한 출처의 데이터를 통합하여 일관성 있는 형태로 저장한다. 이를 위해 데이터 추출, 변환 및 적재(ETL) 과정을 거친다.- 대용량 데이터 저장: 거대한 양의 데이터를 저장하고 관리할 수 있는 구조를 갖추고 있다.- 시계열 데이터 관리: 시간에 따른 데이터 변화를 추적하고 저장할 수 있다.- 성능 최적화: 대규모 데이터를 효율적으로 조회하고 분석할 수 있..
백그라운드 실행 nohup superset run -h 0.0.0.0 -p 8088 --with-threads --reload & 만약 이런 종류의 에러가 나온다면? Error: Could not locate a Flask application. You did not provide the "FLASK_APP" environment variable, and a "wsgi.py" or "app.py" module was not found in the current directory. Usage: superset [OPTIONS] COMMAND [ARGS]... Try 'superset --help' for help. Error: Could not locate a Flask application. You di..
superset에 로컬 MySQL을 연결할 수 있다를 가정하에 작성된 글입니다. Config.py 수정 superset의 설정 정보 파일에 옵션을 추가한다. FEATURE_FLAGS = { 'SSH_TUNNELING': True, } SSH_TUNNEL_MANAGER_CLASS = "superset.extensions.ssh.SSHManager" SSH_TUNNEL_LOCAL_BIND_ADDRESS = "127.0.0.1" 그럼 원래 없던 SSH 터널링 옵션이 제일 밑에 생성될 것이다. Workbench에서 RDS 연동 했던 것과 동일하게 설정 정보를 기입하고 Connect를 하면 된다. pem키로 설정을 했는데 pem키는 어떻게 보는지 모르겠다면? pem 파일이 있는 위치로 이동 한 후 밑에와 같은 명..
관계형 데이터베이스(RDBMS)관계형 데이터베이스(Relational Database)는 데이터를 테이블 형태로 저장하고 관리하는 데이터베이스관계형 데이터베이스의 핵심 개념은 관계(Relation)로, 데이터를 행(Row)과 열(Column)로 구성된 2차원 테이블에 저장한다.이러한 테이블들은 서로 관계를 맺고, 이를 통해 다양한 데이터 조작과 쿼리를 수행할 수 있다. 대표적인 관계형 데이터베이스1) 프로덕션 데이터베이스: MySQL, PostgreSQL, Oracle 등등- OLTP(OnLine Transaction Processing)- 빠른 속도에 집중, 서비스에 필요한 정보 저장- 백엔드 및 프론트엔드 개발자, 데이터 업계 종사자들 사용 2) 데이터 웨어하우스: Redshift, Snowflake..
Date 필드의 기본값을 현재 시간으로 하려고 한다면 CURRENT_TIMESTAMP로 많이 쓰인다.다만 다른 설정을 해주지 않으면 한국시간보다 -9시간으로 글로벌 시간이 지정되어있다.참고 - https://shwjdqls.github.io/aws-mysql-timezone-encoding/ Time_zone 변경이 명령문을 Workbench나 터미널에서 MySQL Shell에 접속해서 치게 되면 현재 Time_zone 설정을 볼 수 있다.select @@global.time_zone, @@session.time_zone; UTC기준으로 Time_zone이 설정되어 있었고, 나는 Asia/Seoul로 변경하고 싶었다.SET time_zone='Asia/Seoul';SET GLOBAL time_zone='..
SSH 터널링SSH(Secure Shell) 프로토콜을 사용하여 네트워크 상의 다른 컴퓨터와 안전하게 통신할 수 있는 방법이다. 주로 두 가지의 유형이 있는데1. 로컬 포트 포워딩2. 리모트 포트 포워딩 현재 글에서는 로컬 포트 포워딩으로 진행될 것이다.서버는 EC2의 서버가 될 것이고, 데이터베이스는 RDS가 될 것이다.서버는 Ubuntu를 사용 중이다. 설치1) 라이브러리 설치pip install sshtunnel 2) 라이브러리 importfrom sshtunnel import SSHTunnelForwarder 3) Setting.py의 Database섹터에 SSH 터널 설정server = SSHTunnelForwarder( (Environ.SSH_TUNNEL_HOST, Environ.SSH_..
파이썬 3.8 버전으로 venv를 생성하려다가 에러를 만났다. Error: Command '['/home/ubuntu/pica_team/pica_proj/pica_venv/bin/python3.8', '-Im', 'ensurepip', '--upgrade', '--default-pip']' returned non-zero exit status 1. 1) pip 없이 가상환경 생성 python3.8 -m venv venv --without-pip 2) 가상환경 활성화 source venv/bin/activate 3) pip 파일 받아오기 curl https://bootstrap.pypa.io/get-pip.py -o get-pip.py 4) pip 설치 python get-pip.py * 근데 여기서 이런..