홈
태그
방명록

분류 전체보기 (61)

인기포스트

ABOUT ME

공부+개발

트위터
인스타그램

Today

Yesterday

Total

moral tiger's moral tiger's

컨텐츠 검색 블로그 내 검색

반응형

입실론그리디

미로 찾기 ai -강화학습(q-table,입실론 그리디 정책)
프로그래밍/python 2023. 6. 7. 11:23

미로를 생성하고 최단거리로 탈출하는 Q-테이블을 찾는 AI를 만들었습니다. 미로 생성은 깊이 우선 탐색을 사용하였고, 탈출 과정에서는 앱실론 그리디 정책을 적용했습니다. AI는 미로를 최단 경로로 탈출하기 위해 Q-테이블을 활용합니다. Q-테이블은 상태(State)와 행동(Action)을 기반으로 최적의 가치(Value)를 예측하는 테이블입니다. AI는 현재 상태에서 최적의 행동을 선택하고, 행동을 수행한 후에는 Q-테이블을 업데이트하여 학습합니다. 이 방법은 탐색과 이용을 균형있게 조정하여 최적의 경로를 탐색하면서도 이미 발견한 경로를 활용합니다. 아래는 소스 코드입니다. maze_ai.py (강화학습을 진행하여 미로를탈출하는 모듈) import pygame import numpy as np impor..

이전

1

다음

인기포스트

ABOUT ME

공부+개발

LINK

디스코드

ADMIN

admin 글쓰기

반응형

Designed by Tistory.

티스토리툴바

단축키

내 블로그

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

블로그 게시글

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

모든 영역

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

* 단축키는 한글/영문 대소문자로 이용 가능하며, 티스토리 기본 도메인에서만 동작합니다.