본문 바로가기

컴퓨팅

(16)
Python_generator 결과만 두고 보면 'for제어문'과 같다고 보는게 맞다. -서로 동일하게 보되, generator은 객체로서 사용 라이브러리에 따라 Return값이 다를 수 있음만 인지 와 은 서로 같다라고 생각하고 출발하는 것이 이해하기 쉽다. def generator(n): i = 0 while i < n: yield i i += 1 for x in generator(5): print(x) for x2 in range(5): print(x2) print(x,x2) 두 제어문 모두 1,2,3,4를 출력하며 마지막 메모리에 있는 값도 x=x2=4 동일하다. 그럼 왜 generator를 쓰는 것인가. 눈으로 직접 확인 가능한 분명한 차이 - 기본적인 제어문에서는 in 다음에는 '배열'구조만 받는다. - 그러나 genera..
관계형 데이터 모델링_모든 내용 MODEL - 어떤 목적을 가지고 진짜를 모방한 것 - 목적 : 관계형데이터베이스의 '표(Table)'에 정보를 담는 것 - 효과 : 일단 모델(표)이 완성되고 나면 그 다음 데이터는 엄청난 양의 데이터를 빠른 속도로 다룰 수 있다. *그러나 거대하고 복잡한 현실세계를 정보로 만들어서 표에 담는 것이 매우 힘든 작업이라는 점. 이러한 힘든 작업은 일반인이 하기 힘들었지만 점점 내용이 체계화 되면서 DATA MOELING이라는 이름으로 현실세계를 컴퓨터로 옮기는 학문이 탄생했다. DATA MODELING의 전체 흐름 1. 업무 파악 2. 개념적 데이터 모델링 3. 논리적 데이터 모델링 4. 물리적 데이터 모델링 1. 업무 파악 현실세계에서 분석하려는 실무에 대해 개념적으로 이해해야 컴퓨터로 정확히 프로그래..
Pandas_DataFrame _processing_Tech 1. df[조건형] -> 특정 칼럼 조건에 맞는 행으로 모든 칼럼 출력 individual_features_df = [] for i in range(0, len(df_num.columns) - 1): # -1 because the last column is SalePrice tmpDf = df_num[[df_num.columns[i], 'SalePrice']] tmpDf = tmpDf[tmpDf[df_num.columns[i]] != 0] individual_features_df.append(tmpDf) 2. 특정 데이터타입의 칼럼만 알고싶을 때 #1 s = (df.dtypes == 'object') object_cols = list(s[s].index) print("Categorical variable..
카디널리티란 cardinality dict) The number of elements in a set or other grouping, as a property of that grouping. 카디널리티에 대해 공부하다가 개념이 너무 어렵게 설명되어있어서, 핵심적인 내용만 (최대한) 쉽게 정리해보고자 한다. 우선 결론부터 말하자면, '데이터 비중복도 '를 말한다. 즉, 관측치별 중복이 적어 key_value속성이 될 수 있는 정도를 뜻한다. 우리는 테이블을 볼 때 Row 간 특정 값들의 중복도가 ‘낮으면’ 카디널리티가 ‘높다’고 표현한다. 중복도가 ‘높으면’ 카디널리티가 ‘낮다’고 표현한다. 카디널리티는 전체 행에 대한 특정 컬럼의 중복 수치를 나타내는 지표이다. 이정도만 설명해도 말이 너무 어려운 것 같다. 하지만..
Anaconda_prompt cceeddcc.tistory.com/4 1. 기본적인 명령어 아나콘다(Anaconda) 키워드 [버전확인] conda --version [아나콘다 업데이트] conda update conda [라이브러리(패키지)명과 버젼확인] conda list [라이브러리(패키지) 설치 및 업데이트] conda install 라이브러리명 conda update 라이브러.. cceeddcc.tistory.com 2. conda install -c conda-forge velog.io/@prayme/conda%EB%9E%80 conda란? 운이 좋게 이번 방학에 KISTI 슈퍼컴퓨팅인프라센터에서 알바를 하게 되었다. 슈퍼컴퓨터의 OS는 당연히 linux이고 Centos를 사용하고 있었다. 개발을 하던 도중 깔려있지 않은..
python_English to Korean CalledProcessError: Command '['dot', '-Kdot', '-Tsvg']' returned non-zero exit status 1. [stderr: b'There is no layout engine support for "dot"\r\nPerhaps "dot -c" needs to be run (with installer's privileges) to register the plugins?\r\n'] ㄴ point : no graphviz engine for 'dot' beacause I installed 2.44.1 but in conda, installed graphviz_version_2.38 plug in : 연결하다. 접속하다 layout engine : 엔진(web에..
pandas_데이터 탐색을 위해 사용할 수 있는 함수들 1. df.head() : 앞에 10행을 샘플로 보여준다. 2. df.shpae() :데이터 전체 행렬 구조를 보여준다. 3. df.describe() :칼럼별로 기초기술통계를 보여준다. 4. df.info() : 칼럼별로 행렬크기, null 유/무, 자료형 5. df.count() : 칼럼별 카운트 6*. pd.value_counts(df.values.flatten()) : 칼럼 속성별로 카운팅을 하고 싶을 때 데이터프레임 구조에서도 할 수 있는 방법 stackoverflow.com/questions/19392226/attributeerror-dataframe-object-has-no-attribute 7.series.value_counts() : 칼럼에서 속성 별 카운팅 8.series.unique(..
HTML 입문 HTML 입문 개요 HTML이란 무엇일까요? 수학에서 덧셈 기호를 +로 나타내고, 뺄셈 기호를 -로 나타내듯 웹 사이트에서 화면에 표시되는 정보를 약속 한 것이 HTML입니다. HTML은 HyperText Markup Language의 약자인데요, HyperText는 단순 텍스트 이상의, 링크 등의 개념이 포함 된 텍스트 Markup은 꺽쇠()로 이루어진 태그를 사용하는 규격 으로, 태그들을 이용하여 텍스트 이상의 요소를 정의하는 약속된 언어라고 할 수 있습니다. 실제로 웹사이트에 표시되는 문자, 사진, 영상, 레이아웃 모두 HTML로 구성되어있죠. 마크업 그렇다면 마크업에 대해서 알아봅시다. 아래와 같은 코드가 마크업 형식을 따르는 텍스트입니다. Tom Amy Welcome to my homepage!..