개발로 자기계발
728x90
SMALL
RedShift 및 SQL 다루기

클러스터여러 개의 노드로 구성된 하나의 분산 시스템을 의미하며, 각 노드에는 CPU, 메모리, 스토리지 등의 컴퓨팅 리소스가 있어 데이터 처리와 분석 작업을 병렬로 수행할 수 있다. 관계형 데이터베이스 사용자 / 세션1) 사용자 ID(User ID):- 사용자 ID는 데이터베이스에 저장된 각 사용자를 고유하게 식별하는 식별자(일반적으로 사용자 계정, 프로필, 인증 정보와 연관)- 사용자 ID는 데이터베이스의 다른 테이블에도 참조될 수 있으며, 이를 통해 사용자 관련 데이터를 연결하고 추적할 수 있다.2) 세션 ID(Session ID):- 세션 ID는 사용자가 웹 사이트나 애플리케이션을 사용하는 동안 지속되는 인터랙션을 식별하기 위한 고유한 식별자- 사용자가 로그인하거나 웹 사이트를 방문할 때, 서버는 ..

데이터 웨어하우스와 클라우드(Redshift) 소개
Database & Data/기타 2023. 5. 9. 00:11

데이터 웨어하우스란(Data Warehouse)?조직이나 기업에서 다양한 출처의 데이터를 통합, 저장하고 분석할 수 있도록 구성된 대규모 데이터 저장소이다.데이터 웨어하우스는 데이터 마이닝, 비즈니스 인텔리전스(BI), 리포팅, 분석 등의 목적으로 사용되며, 이를 통해 의사결정에 도움을 주는 인사이트를 얻을 수 있다. 1) 주요 특징- 데이터 통합: 다양한 출처의 데이터를 통합하여 일관성 있는 형태로 저장한다. 이를 위해 데이터 추출, 변환 및 적재(ETL) 과정을 거친다.- 대용량 데이터 저장: 거대한 양의 데이터를 저장하고 관리할 수 있는 구조를 갖추고 있다.- 시계열 데이터 관리: 시간에 따른 데이터 변화를 추적하고 저장할 수 있다.- 성능 최적화: 대규모 데이터를 효율적으로 조회하고 분석할 수 있..

EC2: Superset 백그라운드 실행 간 환경 변수 에러
버그처리 2023. 5. 8. 22:56

백그라운드 실행 nohup superset run -h 0.0.0.0 -p 8088 --with-threads --reload & 만약 이런 종류의 에러가 나온다면? Error: Could not locate a Flask application. You did not provide the "FLASK_APP" environment variable, and a "wsgi.py" or "app.py" module was not found in the current directory. Usage: superset [OPTIONS] COMMAND [ARGS]... Try 'superset --help' for help. Error: Could not locate a Flask application. You di..

Superset SSH 터널링을 통한 RDS(MySQL) 연결
Cloud 2023. 5. 8. 22:13

superset에 로컬 MySQL을 연결할 수 있다를 가정하에 작성된 글입니다. Config.py 수정 superset의 설정 정보 파일에 옵션을 추가한다. FEATURE_FLAGS = { 'SSH_TUNNELING': True, } SSH_TUNNEL_MANAGER_CLASS = "superset.extensions.ssh.SSHManager" SSH_TUNNEL_LOCAL_BIND_ADDRESS = "127.0.0.1" 그럼 원래 없던 SSH 터널링 옵션이 제일 밑에 생성될 것이다. Workbench에서 RDS 연동 했던 것과 동일하게 설정 정보를 기입하고 Connect를 하면 된다. pem키로 설정을 했는데 pem키는 어떻게 보는지 모르겠다면? pem 파일이 있는 위치로 이동 한 후 밑에와 같은 명..

관계형 데이터베이스와 SQL 소개

관계형 데이터베이스(RDBMS)관계형 데이터베이스(Relational Database)는 데이터를 테이블 형태로 저장하고 관리하는 데이터베이스관계형 데이터베이스의 핵심 개념은 관계(Relation)로, 데이터를 행(Row)과 열(Column)로 구성된 2차원 테이블에 저장한다.이러한 테이블들은 서로 관계를 맺고, 이를 통해 다양한 데이터 조작과 쿼리를 수행할 수 있다. 대표적인 관계형 데이터베이스1) 프로덕션 데이터베이스: MySQL, PostgreSQL, Oracle 등등- OLTP(OnLine Transaction Processing)- 빠른 속도에 집중, 서비스에 필요한 정보 저장- 백엔드 및 프론트엔드 개발자, 데이터 업계 종사자들 사용 2) 데이터 웨어하우스: Redshift, Snowflake..

article thumbnail
RDS(MySQL) - 서버 시간을 한국 시간으로 변경하기(권한 에러 추가)
Database & Data/MySQL 2023. 5. 7. 16:32

Date 필드의 기본값을 현재 시간으로 하려고 한다면 CURRENT_TIMESTAMP로 많이 쓰인다.다만 다른 설정을 해주지 않으면 한국시간보다 -9시간으로 글로벌 시간이 지정되어있다.참고 - https://shwjdqls.github.io/aws-mysql-timezone-encoding/ Time_zone 변경이 명령문을 Workbench나 터미널에서 MySQL Shell에 접속해서 치게 되면 현재 Time_zone 설정을 볼 수 있다.select @@global.time_zone, @@session.time_zone; UTC기준으로 Time_zone이 설정되어 있었고, 나는 Asia/Seoul로 변경하고 싶었다.SET time_zone='Asia/Seoul';SET GLOBAL time_zone='..

Django에서 SSH 터널링(EC2)으로 RDS 연동하기
Develop/Django 2023. 5. 5. 19:19

SSH 터널링SSH(Secure Shell) 프로토콜을 사용하여 네트워크 상의 다른 컴퓨터와 안전하게 통신할 수 있는 방법이다. 주로 두 가지의 유형이 있는데1. 로컬 포트 포워딩2. 리모트 포트 포워딩 현재 글에서는 로컬 포트 포워딩으로 진행될 것이다.서버는 EC2의 서버가 될 것이고, 데이터베이스는 RDS가 될 것이다.서버는 Ubuntu를 사용 중이다. 설치1) 라이브러리 설치pip install sshtunnel 2) 라이브러리 importfrom sshtunnel import SSHTunnelForwarder 3) Setting.py의 Database섹터에 SSH 터널 설정server = SSHTunnelForwarder( (Environ.SSH_TUNNEL_HOST, Environ.SSH_..

EC2: 특정 python버전으로 venv 생성시 에러 날 때(Mac 기준)
버그처리 2023. 5. 5. 12:21

파이썬 3.8 버전으로 venv를 생성하려다가 에러를 만났다. Error: Command '['/home/ubuntu/pica_team/pica_proj/pica_venv/bin/python3.8', '-Im', 'ensurepip', '--upgrade', '--default-pip']' returned non-zero exit status 1. 1) pip 없이 가상환경 생성 python3.8 -m venv venv --without-pip 2) 가상환경 활성화 source venv/bin/activate 3) pip 파일 받아오기 curl https://bootstrap.pypa.io/get-pip.py -o get-pip.py 4) pip 설치 python get-pip.py * 근데 여기서 이런..

reduce와 lambda를 통한 데이터프레임 merge 함수

def merge_dataframes(df_list: list, merge_option: str, column: str): """ 여러 개의 DataFrame을 공통 column을 기준으로 병합하는 메소드. :param df_list: 병합할 DataFrame들의 리스트 :param merge_option: 병합 옵션 ('inner', 'outer', 'left', 'right' 중 하나) :param column: 병합 기준이 되는 공통 column의 이름 :return: 병합된 DataFrame """ merged_df = reduce(lambda x, y: pd.merge(x, y, how=merge_option, on=column), df_list) return merged_df 이 코드는 여러 ..

mysqlclient 설치 에러
버그처리 2023. 5. 1. 17:46

mysql 연동을 하는 도중에 mysqlclient 에러가 나왔다. Collecting mysqlclient Using cached mysqlclient-2.1.1.tar.gz (88 kB) Preparing metadata (setup.py) ... error error: subprocess-exited-with-error × python setup.py egg_info did not run successfully. │ exit code: 1 ╰─> [16 lines of output] /bin/sh: mysql_config: command not found /bin/sh: mariadb_config: command not found /bin/sh: mysql_config: command not fou..

728x90
SMALL