Automated BIM Modeling Based on AI-Generated Imagery - Focusing on Building Façade Wall Pattern Generation and Modeling -

Youngjin Yoo; Hayoon Kim; Jin-Kook Lee

doi:10.13161/kibim.2025.15.4.001

Preview

Research Article

Journal of KIBIM. 31 December 2025. 1-9
https://doi.org/10.13161/kibim.2025.15.4.001

Automated BIM Modeling Based on AI-Generated Imagery - Focusing on Building Façade Wall Pattern Generation and Modeling -

AI 생성 이미지 기반 BIM 모델링 자동화 구현 - 건축물 외관 벽체 패턴 생성 및 모델링을 중심으로 -

Youngjin Yoo¹

Hayoon Kim²

Jin-Kook Lee³^*

유 영진¹

김 하윤²

이 진국³^*

¹정회원, 연세대학교 실내건축학과 석사

²학생회원, 연세대학교 실내건축학과 석사과정

³정회원, 연세대학교 실내건축학과 교수

^{*Corresponding Author}

ABSTRACT

This study proposes a 2D-to-3D algorithm-based framework for automated BIM modeling of building façade wall patterns generated by image generation AI, reflecting diverse design styles, into BIM-compatible 3D models. Initially, façade wall pattern images embodying ten distinct architectural styles were generated using image generation AI. For those styles whose reproduction performance was comparatively low, Low-Rank Adaptation (LoRA)-based domain-specific fine-tuning was applied to enhance image quality. As a result, the style similarity measured by CLIPScore for these targeted styles improved significantly from an average of 16.8% to 67.5%. Following this, the proposed 2D-to-3D algorithm processes the generated images through brightness-to-height mapping, vector point preprocessing, and scale adjustment to automatically produce 3D geometries compatible with BIM environments. The converted 3D models demonstrated an average Structural Similarity Index Measure (SSIM) of 0.71 when compared with the original images, with particularly high fidelity in curve-oriented patterns (up to 0.78). Integrated within a BIM visual programming environment, the system enables users to generate BIM-ready 3D façade wall models from text prompts within 2 to 5 minutes, substantially reducing the time required for pattern creation and design alternative exploration during the early design stages. By extending the creative visualization capabilities of image generation AI into tangible modeling and design execution phases, this framework offers a promising approach to enhance automation and improve efficiency throughout architectural façade design workflows.

Keywords

Facade Wall Pattern Design

BIM (Building Information Modeling)

2D-to-3D Conversion

Image generation AI

Domain-specific model

키워드

외관 벽체 패턴 디자인

BIM (건물 정보 모델링)

2D-to-3D 변환

이미지 생성 AI

도메인 특화 모델

MAIN

1. 서 론
1.1 연구의 배경 및 목적
1.2 연구의 방법 및 범위
2. 이론적 고찰
2.1 텍스트 기반 이미지 생성 기술
2.2 이미지 기반 3D 지오메트리 재구성 기술
3. AI 생성 이미지 기반 BIM 모델링 자동화 방안
3.1 도메인 특화 AI 모델 구축 방안
3.2 도메인 특화 AI 모델 활용 이미지 생성 방안
3.3 이미지 기반 BIM 모델링 알고리즘
4. BIM 모델링 자동화 시스템 구현 및 적용
4.1 도메인 특화 AI 기반 벽체 패턴 이미지 생성
4.2 BIM 벽체 패턴 자동 모델링 및 활용
5. 결 론

1. 서 론

1.1 연구의 배경 및 목적

건축 외관은 형태, 색채, 재질, 패턴 등 다양한 요소의 조합으로 인상이 결정되며, 설계 초기 단계에서는 이들의 여러 대안을 제한된 시간 안에 검토하는 과정이 중요하다. 최근 텍스트 프롬프트 기반 이미지 생성 AI의 발전(Oppenlaender, 2022)은 이러한 초기 설계 과정에 새로운 가능성을 제공하고 있다. 사용자는 간단한 텍스트 설명만으로 건축 내·외관을 비롯해 다양한 패턴 변형안을 수 초 내에 생성할 수 있으며, 특히 복잡한 기하학적 형태나 자유곡선 기반의 비정형 패턴과 같이 기존 도구로 구현하기 어려운 아이디어를 직관적으로 시각화할 수 있다.

그러나 현재 이러한 이미지 생성 기술은 대체로 참조용 시각화 단계에 머물러 있으며, 실질적인 설계 작업으로 이어지는 경우는 드물다. 이는 2D 이미지를 3D 모델로 변환하는 과정이 여전히 수작업에 의존하고 있기 때문이다(Yoo & Lee, 2024). 이로 인해 실제 디자인 적용에 여전히 많은 시간과 인력이 소요되고, 특히 연속성과 정밀한 연결성이 요구되는 패턴 디자인에서는 이러한 문제가 더욱 두드러진다. 따라서 기존 이미지 생성 AI가 제공하는 신속한 시각화의 효율을 설계 모델 제작 단계까지 확장할 수 있는 자동화된 접근이 요구된다.

이미지 기반 3D 모델링 기술(Redweik, 2012; Liu et al., 2023; Li et al., 2020)도 지속적으로 발전해 왔으나, 패턴의 세밀한 연결부 처리 등에서는 한계가 있다. 또한 BIM(Building Information Modeling) 환경에서 활용하기 위해서는 별도의 포맷 변환과 후처리 과정이 필요하여 효율성이 떨어진다(Yang et al., 2018).

이에 본 연구는 건물 외관의 패턴 디자인을 대상으로, 이미지 생성 AI로 제작된 래스터 이미지를 BIM 환경에서 직접 활용 가능한 3D 모델로 자동 변환하는 접근방법을 제안한다(Figure 1). 제안하는 방법은 일련의 이미지 처리 알고리즘을 통해 다양한 디자인 스타일이 반영된 AI 생성 패턴을 3D BIM 모델로 변환한다. 이러한 접근을 통해 생성형 AI가 제공하는 창의적 디자인과 실제 모델링 프로세스를 결합하여 설계 초기 단계의 시각화 및 프로토타입 제작을 지원함으로써 설계 효율성을 향상시키고, 패턴 디자인의 BIM 적용성을 높이며, 그 과정에서 프로토타입 제작과 대안 탐색에 소요되는 시간을 단축하는 것을 목표로 한다.

https://cdn.apub.kr/journalsite/sites/kibim/2025-015-04/N0430150401/images/kibim_15_04_01_F1.jpg

Figure 1.

Proposed 3D modeling automation approach

1.2 연구의 방법 및 범위

본 연구에서는 패턴 이미지를 3D BIM 모델로 자동 변환하는 2D-to-3D 알고리즘을 개발하고, 이를 AI 기반 디자인 프로세스에 적용하여 그 효과를 검증한다. 이를 위한 연구 절차 및 방법은 다음과 같다:

첫째, 도메인 특화 이미지 생성 AI 모델을 구축하여 건축 스타일이 반영된 패턴 이미지를 생성한다. 이를 위해 먼저 베이스 모델을 활용하여 스타일 재현 성능을 평가한 후, 재현도가 낮은 스타일에 대해 LoRA(Low-Rank Adaptation) 기반 추가 학습을 수행하여 도메인 특화 모델을 구축한다. 추가 학습 전과 후의 스타일 일치도는 생성된 이미지를 대상으로 CLIP score를 산출하여 평가한다.

둘째, 생성된 패턴 이미지를 본 연구에서 제안하는 2D-to-3D 변환 알고리즘을 통해 3D BIM 모델로 변환한다. 변환 결과는 SSIM (Structural Similarity Index Measure)을 사용하여 원본 이미지와의 시각적 유사도를 검증한다.

셋째, 최종 변환된 3D 모델을 BIM 환경에 적용하는 과정을 시연하여, 제안 방법이 설계 초기 단계에서 패턴 디자인의 제작 및 대안 탐색 시간을 단축할 수 있는지 검토한다.

본 연구에서는 제안 방법론의 적용 가능성을 검증하기 위해, 고유한 디자인 특성을 지닌 10개의 건축 스타일을 대상으로 실험을 수행한다. 실험 대상 스타일은 시각적 특징이 명확하여 학습 데이터 수집 및 평가가 용이하고, 형태적 다양성(유기적 곡선, 기하학적 구조, 미니멀리즘 등)을 포괄할 수 있는 사례를 중심으로 선정하였다. 이후 분석에서는 Style A~J로 표기한다.

2. 이론적 고찰

2.1 텍스트 기반 이미지 생성 기술

이미지 생성 기술은 생성형 AI의 발전으로 비약적 성장을 이루었으며, 이는 건축 설계 분야에 큰 변화를 가져오고 있다. 2014년 등장한 GANs (Generative Adversarial Networks)는 생성자와 판별자가 경쟁하며 학습하여 사실적인 이미지를 생성하는 모델로(Goodfellow et al., 2020), 건축 분야에서는 파사드 디자인, 실내 레이아웃, 투시도, 건축 평면도 생성 등 다양한 영역에 활용되며 새로운 가능성을 열었다(Xu et al., 2024). 이후 2022년 등장한 확산 모델(Diffussion Models)은 노이즈 제거 기반 방식으로 이미지 및 비디오 생성의 품질을 크게 향상시켰다. 이 모델은 텍스트 프롬프트 기반 이미지 생성을 포함한 다양한 이미지 생성 기술에서 높은 활용 가능성을 보이며 주목받았다(Dhariwal & Nichol, 2021). 이러한 발전은 Stable Diffusion 3 (Sauer et al., 2024)와 GPT‑4o (OpenAI, 2024) 기반 이미지 생성 기능과 같은 최신 이미지 생성 플랫폼 및 멀티모달 생성 시스템의 등장까지 지속되고 있는 추세이다. 이들 플랫폼은 각각의 고유한 알고리즘과 학습 데이터를 바탕으로 차별화된 성능을 보여준다.

이와 같은 생성형 AI 기반 이미지 생성 기술의 고도화는 건축 설계 분야에서도 활용 범위를 확장하고 있다. 특히 확산 모델은 텍스트 기반 이미지 생성 기술(txt2img)과 이미지 기반 생성 기술(img2img)을 모두 지원하며, 건축 시각화 과정에서 두 방식이 병행적으로 활용되고 있다(Betker et al., 2023; Meira & Lopez, 2024). 텍스트 기반 이미지 생성 기술은 건축 설계 초기 단계에서 디자인 아이디어의 신속한 시각화와 대안 탐색에 활용되곤 한다(Yoo & Lee, 2023). 반면, 이미지 기반 생성 기술은 기존 디자인을 기반으로 하는 스타일 변환이나 렌더링 이미지 생성 등에 주로 활용된다. Jo et al. (2024)은 지역 고유의 특성을 반영한 건물 파사드를 시각화하기 위해 텍스트 기반 이미지 생성 모델을 활용하였고, Lee et al. (2024)은 건축가 스타일을 학습시켜 이미지 기반 생성 기술을 통해 다양한 건물 외관 디자인을 생성하는 연구를 수행하였다.

이러한 연구들은 AI가 설계 초기 단계에서 대안 제시를 가속화하고, 창의적 다양성을 확대하는 데 기여할 수 있음을 시사한다. 그러나 현재 대부분의 연구는 여전히 생성 결과물이 2D 비트맵 이미지에 머무르고 있으며, 실제 건축 설계에 필수적인 3D 모델로의 변환은 여전히 수작업에 의존하고 있다(Yoo & Lee, 2024; Choi & Lee, 2023). 즉, 2D로 생성된 시각 결과물과 3D 모델링 간의 간극을 해소하는 기술적 연결 방법이 부재하며, 이를 해결하는 것이 향후 생성형 AI의 실질적 설계 적용을 위한 과제로 남아 있다.

2.2 이미지 기반 3D 지오메트리 재구성 기술

이미지 기반 3D 지오메트리 재구성(Reconstruction) 기술은 시각 정보를 활용하여 3D 형상을 복원하는 기술로, 다양한 분야에서 오랜 기간 연구되어왔다. 기술 발전 흐름은 크게 다중 이미지 기반 기술과 단일 이미지 기반 기술로 나눌 수 있다. 초기의 대표적 기법인 포토그래메트리(Photogrammetry)는 다양한 시점에서 촬영한 복수 이미지로부터 포인트 클라우드를 추출하고, 이를 기반으로 3D 모델을 생성하는 방식이다(Redweik, 2012). 하지만 이 방식은 다수의 고해상도 이미지가 필요하며, 반사성 재료 인식에 한계가 있다. 이를 개선한 Neural Radiance Fields (NeRF; Mildenhall et al., 2021)은 상대적으로 적은 수의 이미지로도 3D 재구성을 가능하게 했으며, 방사도 및 밀도 예측을 통해 보다 연속적인 모델을 생성할 수 있다. 그러나 여전히 상세한 모델링을 위해서는 여러 장의 이미지가 필요하며, 매번 모델 훈련이 필요하다는 한계를 지닌다.

한편, 단일 이미지의 내재적 정보를 활용하여 3D 표면을 재구성하는 접근도 연구되고 있다. Jian et al. (2018)은 실외 환경에서의 조명 변화에도 대응할 수 있는 Z-Depth 기반 표면 재구성 기법을 제안하였다. 이 접근법은 이미지의 밝기와 명암 차이를 활용하여 깊이를 추정하며, 비교적 단순한 이미지에서도 안정적인 결과를 도출할 수 있다는 장점이 있다. Wahbeh et al. (2022)은 보다 복합적인 접근을 통해, 드론 기반 항공 영상과 모바일 매핑 데이터를 융합하여 고해상도 도시 3D 모델을 자동으로 재구성하는 전략을 제시했다. 이들은 다중 영상 간 정밀한 공간 정합을 통해 대규모 도시 환경의 복잡한 지형과 구조를 정밀하게 재현하였다. 그러나 이러한 기존 기법들은 여전히 단일 이미지 기반으로 정밀한 3D 패턴을 자동 재구성하는 데에는 한계가 있으며, 특히 건축 패턴 디자인과 같이 높은 정밀도와 연결성이 요구되는 설계 분야에서는 실질적인 활용이 어렵다.

최근 생성형 AI 기술의 발전으로, 단일 이미지 기반의 3D 재구성 방식에서도 새로운 접근이 등장하고 있다. SyncDreamer (Liu et al., 2023)와 TripoSR (Tochilkin et al., 2024)는 단일 이미지를 입력으로 받아, 다중 시점의 시각 정보를 예측하고 이를 기반으로 전체 3D 모델을 복원하는 방식을 제안하였다. 이들은 기존의 다중 이미지 기반 기법에 비해 입력 데이터 요구량을 크게 줄였으며, 자동화 수준도 높은 것으로 평가된다. 그러나 생성된 메시의 연결 정밀도나 형상 균일성은 여전히 낮은 편이며, 특히 정확한 연결성과 반복적 형태가 중요한 건축 패턴 모델링에는 적용이 어렵다(Liu et al., 2023; Tochilkin et al., 2024). 이러한 한계로 현재 기술은 정밀한 연결성과 균일성이 요구되는 건축 패턴 모델링에 직접 적용하기에는 어려움이 있다. 또한 대부분의 결과물은 특정 뷰어 환경에 한정되거나, BIM 시스템과의 연계 활용이 제한적이라는 점에서 실무적 확장성에도 한계가 존재한다(Yang et al., 2018; Kim et al., 2022). 따라서, 단일 이미지 기반 3D 재구성 기술을 BIM 기반 건축 설계에 직접 통합하여 활용하기 위한 연구는 여전히 제한적인 상황이다. 이러한 배경에서, 건축 패턴 디자인과 같이 고도의 정밀성이 요구되는 분야에 있어 실질적인 설계를 위한 자동화 방법론의 필요성이 제기된다.

3. AI 생성 이미지 기반 BIM 모델링 자동화 방안

3.1 도메인 특화 AI 모델 구축 방안

본 연구에서는 특정 디자인 스타일과 벽체 패턴 특성을 효과적으로 반영한 이미지를 생성하기 위해 도메인 특화 AI 모델을 구축한다. 도메인 특화 AI 모델은 범용적으로 사전 학습(Pretraining)된 이미지 생성 AI 모델(이하 베이스 모델)에 특정 분야의 데이터를 추가 학습하여, 해당 분야의 시각적 특성을 재현할 수 있도록 조정한 모델을 의미한다. 이러한 도메인 특화 AI 모델은 개인이 자체 디자인 데이터셋을 활용하여 고유의 스타일을 학습한 AI 모델을 구축할 수 있도록 한다.

도메인 특화 AI 모델을 구축하는 추가학습 방법은 다양하며, 학습 환경과 목적에 따라 선택할 수 있다. 대표적인 방법으로는 모델 전체 파라미터를 업데이트하는 DreamBooth (Ruiz et al., 2023)와, 특정 계층만을 업데이트하는 LoRA (Hu et al., 2021) 등이 있다. DreamBooth는 소수의 이미지로 특정 객체를 세밀하게 재현할 수 있으나, 범주형 스타일 일반화에는 과적합 가능성이 높고, 전체 파라미터를 학습하므로 연산 자원과 저장 공간 요구가 크다는 단점이 있다. 반면, LoRA는 교차-어텐션(cross-attention)과 같은 핵심 계층에 저차원 행렬을 삽입하여 필요한 파라미터만 업데이트하는 방식으로, 학습 파라미터 수와 메모리 사용량을 크게 줄이면서도 시각적 특성을 안정적으로 학습할 수 있다. 본 연구에서는 이 중 비교적 낮은 연산 자원 제약과 높은 적용성 가진 LoRA를 사용하여 도메인 특화 AI 모델을 구축한다.

LoRA 기반 추가학습은 고품질의 이미지와 텍스트로 구성된 도메인 특화 데이터셋을 바탕으로 수행된다. 이미지 데이터는 목표 도메인의 시각적 특성을 충분히 반영하도록 다양한 구도, 비율, 조명, 색채 조건을 포함하여 수집하며, 필요에 따라 불필요한 배경 등의 노이즈 제거와 해상도 정규화 등의 전처리가 적용된다. 텍스트 데이터는 각 이미지에 나타나는 형태, 재질, 배경 정보를 구체적이고 일관된 용어로 기술하여 시각 정보와의 상호 참조가 가능하도록 구성된다. 이렇게 수집·전처리된 모든 이미지–텍스트 쌍(pair)은 동일한 이름으로 저장되어 하나의 데이터셋으로 구축된다.

데이터셋 구축이 완료되면, 추가학습을 위한 하이퍼파라미터를 설정한다. 본 연구에서는 선행연구(Yoo & Lee, 2024)에서 검증된 Table 1의 하이퍼파라미터 구성을 기반으로, LoRA 구조와 데이터셋 특성에 맞게 학습률(learning rate), 배치 크기(batch size), 학습 단계(step) 등을 조정하여 학습을 수행한다. 학습이 완료된 도메인 특화 모델은 목표 디자인 스타일이 반영된 패턴 이미지를 생성하는 데 활용된다.

Table 1.

Hyperparameters used for fine-tuning (Yoo & Lee, 2024)

Hyperparameters	Description	Used value
Batch size	Number of datasets to be simultaneously trained at once	1
Epoch	Number of times a single batch is iterated during training	100
Learning rate	Step size at which the learning weights are updated during training	0.0001

3.2 도메인 특화 AI 모델 활용 이미지 생성 방안

본 연구에서 사용하는 벽체 패턴 이미지는 텍스트 기반 이미지 생성 방식을 통해 생성한다. 이 방식은 사용자가 입력하는 텍스트 프롬프트와 매개변수를 통해 원하는 스타일의 패턴 이미지를 생성한다. 이 과정에서 프롬프트의 내용과 구조를 전략적으로 설계하는 프롬프트 엔지니어링을 통해 이미지의 정확도와 재현성을 높인다. 이를 위해 긍정 프롬프트에는 생성하고자 하는 패턴의 구체적인 디자인 특징과 이미지 품질을 높이기 위한 키워드를 상세하게 포함한다. 동시에 부정 프롬프트를 함께 사용하여 원치 않는 형태나 불필요한 요소를 배제한다.

프롬프트 엔지니어링만으로 재현이 어려운 스타일의 경우, 해당 스타일을 반영하도록 학습된 도메인 특화 AI 모델을 활용한다. 이 모델은 기존 베이스 모델에 적용하여 사용하며, 생성 과정에서 스타일 반영 강도를 조절함으로써 대규모 사전학습 데이터와 추가학습 데이터의 특성이 균형 있게 반영되도록 한다.

매개변수의 경우, 일반적인 이미지 생성과 달리, 벽체 패턴과 같이 연속성이 필수적인 디자인에서는 비대칭 타일링(asymmetric tiling) 기능을 활용하여 생성된 이미지의 가장자리가 X축과 Y축 방향으로 매끄럽게 이어지도록 한다. 본 연구에서는 Table 2에 제시된 매개변수를 모든 생성 과정에서 동일하게 적용하여 결과의 일관성을 유지하였다.

이러한 과정을 통해, 다양한 스타일에 기반한 고품질 패턴 이미지를 안정적으로 생성할 수 있으며, 생성된 이미지는 후속 2D-to-3D 변환 과정의 입력 데이터로 활용된다.

Table 2.

Parameters used for pattern image generation

Parameters	Description	Used value
Sampling method	Type of technique for sample extraction from the latent space	DPM++ 2M Karras
Sampling method	Number of intermediate stages between the initial and final states	25
CFG scale	Level of autonomy or reliance on pre-defined classifiers of the model	5
Resolution	Image dimension in pixels	1024×1024
Asymmetric tiling	Control for seamless image repetition along specified axis	Tile X, TIle Y

3.3 이미지 기반 BIM 모델링 알고리즘

AI 생성 이미지의 BIM 모델링은 패턴의 밝기(brightness) 값을 3차원 높이 정보로 변환하는 2D-to-3D 알고리즘을 통해 수행된다. 이 알고리즘은 패턴의 여섯 면 중 특히 외부 면을 재현하는 데 중점을 두며, 3D 표면 재구성 방법(Jian et al., 2018)과 유사한 원리를 사용한다. 전체 과정은 Figure 2와 같이 1) 이미지-벡터 변환, 2) 벡터 포인트 전처리, 3) 3D 패턴 지오메트리 생성, 그리고 4) 스케일 보정의 네 단계로 구성된다.

https://cdn.apub.kr/journalsite/sites/kibim/2025-015-04/N0430150401/images/kibim_15_04_01_F2.jpg

Figure 2.

2D-to-3D algorithm

이미지-벡터 변환 단계에서는 2차원 픽셀 정보로부터 3차원 공간상의 벡터 포인트 배열을 추출한다. 입력 이미지를 균일한 그리드로 분할한 뒤, 각 셀의 중심에 포인트를 배치하고, 해당 영역의 평균 밝기 값을 z축 좌표(높이)로 변환한다. 밝은 영역일수록 높은 z값을, 어두운 영역일수록 낮은 z값을 부여하여, 명암 대비가 입체적인 높이 분포로 표현된다.

벡터 포인트 전처리 단계에서는 3D 모델링의 정밀도와 일관성을 높이기 위해 z값을 보정한다. 우선 경계선이 매끄럽게 연결되도록 가장자리 포인트의 z값을 해당 엣지 양 끝점의 평균값으로 조정하여, x축·y축 방향 끝점들이 동일한 높이를 갖도록 정렬한다. 이어서 비닝(binning) 기법을 적용해 z값을 일정 구간으로 나누고, 각 구간을 대표값으로 대체한다. 이 과정은 복잡한 수치 변화를 단순화함으로써, 표면 형상의 규칙성을 높이고 이후의 모델링 과정에서 계산 효율성을 확보할 수 있다. 이후 전체 모델의 기준면 정렬을 위해 모든 포인트의 z값에서 최소값을 조정하여 최소 z값이 0이 되도록 이동시키고, 처리 과정에서 순서가 변한 포인트들은 좌표값을 기준으로 재정렬한다. 이를 통해 패턴 형상의 상대적 높이를 유지하면서도 BIM 소프트웨어에서 기준면에 정확히 위치하도록 한다.

3D 패턴 지오메트리 생성 단계에서는 정제된 벡터 포인트를 기반으로 실제 3D 모델을 생성한다. 정렬된 포인트를 순차적으로 연결하여 외곽 경계선과 내부 곡선을 생성하고, 이를 기반으로 3D 표면 메쉬(mesh)를 생성한다. 이때, 천공(perforation) 구조가 포함된 패턴의 경우에는, 사용자가 미리 설정한 높이를 기준으로 상부 또는 하부를 절단(cropping)해 프레임과 유리 부분을 명확히 구분할 수 있도록 한다. 이후 구분된 프레임과 유리 부분에는 사용자가 지정한 재료와 사전 정의된 유리 재료가 각각 자동으로 적용된다.

마지막 스케일 보정 단계에서는 생성된 3D 지오메트리 모델을 최종 활용 목적에 맞춰 치수를 자동 조정한다. 사용자가 미리 정의한 가로·세로·높이 등 목표 치수에 맞춰 크기를 보정한 후, BIM 소프트웨어에서 활용할 수 있도록 해당 모델을 BIM 객체로 최종 내보내기(export)한다. 생성된 패밀리는 LoD 200 수준으로, 프레임과 패널로 구분된 구조를 가지며, 재료 정보 및 규격 등의 속성 정보를 포함한다. 이를 통해 모델링 완료 후에도 BIM 환경 내에서 치수 및 재료를 수정할 수 있다. 또한 사용자는 필요에 따라 알고리즘 조정을 통해 다른 형태의 패턴 기반 패밀리로 저장 형태를 변경할 수도 있다.

4. BIM 모델링 자동화 시스템 구현 및 적용

4.1 도메인 특화 AI 기반 벽체 패턴 이미지 생성

본 연구의 AI 기반 BIM 모델링 자동화 시스템을 구현하기 위해, 먼저 베이스 모델을 활용하여 10개의 건축 스타일이 반영된 패턴 이미지를 생성하고 재현 성능을 평가하였다. 이를 위해 각 스타일별 대표 키워드 5개와 명칭을 프롬프트에 포함하고, Table 2의 매개변수를 적용하여 약 5,000장의 초기 이미지를 생성하였다. 이후, 생성된 이미지가 각 스타일의 키워드를 얼마나 잘 반영했는지 정량적으로 평가하기 위해 CLIPScore (Hessel et al., 2022)를 활용하였다. CLIPScore는 이미지와 텍스트 간 의미적 유사도를 계산하는 지표로, 본 연구에서는 CLIP ViT-B/32 모델을 사용하여 AI 생성 이미지와 스타일 키워드 간 유사도를 산출하였다. 평가는 사전에 도출한 스타일별 주요 시각적 특성 키워드 5개를 기준으로 수행하였다.

평가 결과, Table 3의 Style A와 같이 시각적 상징성이 뚜렷하고 보편적으로 잘 알려진 스타일은 높은 일치도를 보였으나, Style I와 같은 일부 스타일은 시각적 특징이 명확히 재현되지 않는 한계가 나타났다. 이는 베이스 모델만으로는 특정 전문 분야의 미묘한 스타일 차이를 모두 재현하기는 어렵다는 점을 보여준다.

Table 3.

Performance comparison between base model and fine-tuned model

Case	Base model (high performance)	Base model (low performance)	Fine-tuned model (improved performance)
Style	Style A	Style I
Stylistic features	Nature-inspired curves, asymmetric tessellation, mosaic surfaces, surrealistic, color-coded	Wooden gridshell, modular repetition, perforated voids, sustainability, organic material
Generated Images
CLIPscore	68.4%	17.6%	65.5%

스타일 일치도 평가를 바탕으로, 초기 평가에서 CLIPScore가 20% 미만으로 낮게 나타난 4개의 스타일(Style D, F, H, I)을 대상으로 LoRA 기반 추가학습을 진행하였다. 이들 스타일은 고유한 디자인 특성을 보유하고 있음에도 베이스 모델에서 특징이 충분히 반영되지 않았기에, 재현 성능 향상을 위해 Figure 3과 같이 도메인 특화 데이터셋을 구축하였다. 이미지 데이터는 해당 스타일에 속하는 건축 사례 중 패턴이 잘 드러난 부분을 수집하여 구성하였다. 이후 굴곡을 최소화하는 전처리를 거친 뒤, 단위(Unit)별 패턴을 추출하고 좌우 반전 등 변형 기법을 적용하여 다양한 크기와 형태의 데이터셋을 구축하였다. 텍스트 데이터는 각 이미지의 자재, 형태, 스타일 특성을 설명하는 키워드를 조합해 작성하였다. 이후 이미지와 텍스트를 쌍으로 매칭하여 스타일별 약 100개의 학습 데이터셋을 구축하였다. 이 데이터셋을 사용하여, Table 1의 하이퍼파라미터를 적용해 추가학습을 수행하였다. 학습은 RTX 4090 GPU 환경에서 진행되었으며, 도메인 특화 모델 한 개의 학습에는 약 2시간이 소요되었다.

https://cdn.apub.kr/journalsite/sites/kibim/2025-015-04/N0430150401/images/kibim_15_04_01_F3.jpg

Figure 3.

Dataset construction process (Example of Style I)

추가학습 결과, 4개의 스타일 일치도(CLIPScore) 평균은 16.8%에서 67.5%로 약 4배 이상 향상되었다(Table 3). 이는 초기 베이스 모델이 관련 스타일 키워드를 거의 무작위로 해석하던 수준에서, 추가학습 후 생성 이미지가 키워드의 의미와 높은 시각적 연관성을 갖게 되었음을 의미한다. 예를 들어, Style I의 경우 스타일 일치도가 17.6%에서 65.5%로 상승하며, 목재 기반 구조나 격자형 반복 패턴과 같은 핵심 디자인 특성이 명확하게 표현되었다. 이러한 정성적 개선은 다른 세 개의 스타일에서도 일관되게 확인되었으며, 이를 통해 LoRA 기반 추가학습의 효과와 안정성을 검증할 수 있었다.

이와 같은 결과는 LoRA 기반 추가학습이 소규모 데이터셋만으로도 베이스 모델을 효과적으로 보완하여, 특정 스타일 특성을 반영하는 도메인 특화 AI 모델을 구축할 수 있음을 보여준다. 본 연구에서는 학습된 도메인 특화 AI 모델을 활용해 해당 스타일 이미지를 총 2,000여장 생성하고, 이를 기존 데이터셋의 동일 수량 이미지와 교체하였다. 이렇게 조정된 최종 생성 이미지 데이터 5,000장 중에서, 형태적 특징이 불분명하거나 명암 대비가 약해 3D 모델 변환에 부적합한 이미지를 제외하고 선별한 고품질 이미지 200장을 BIM 모델링을 위한 입력 데이터로 사용하였다.

4.2 BIM 벽체 패턴 자동 모델링 및 활용

제안된 2D-to-3D 알고리즘은 시연을 위해 BIM 소프트웨어의 비주얼 프로그래밍 환경에서 구현되었으며, 일부 정밀한 계산 과정에는 Python 스크립트를 병행하였다(Figure 4). 사용자는 BIM 소프트웨어 내에서 제공되는 알고리즘 플레이어를 통해 별도의 코드 수정 없이 패턴의 스케일, 높이, 재료 등의 주요 매개변수를 설정할 수 있다. 패턴 이미지를 선택하고 2D-to- 3D 알고리즘을 실행하면, 약 2~5분 내에 3D 패턴 지오메트리가 생성되며, 이를 곧바로 BIM 모델의 입면 파사드 패널에 직접 적용할 수 있다. Table 4는 이러한 과정을 스타일별 이미지 생성부터 패턴 패밀리로의 3D 모델링, 그리고 BIM 내에서 커튼월 시스템의 커튼 패널로 적용되는 과정까지 단계별 결과물 예시를 보여준다.

https://cdn.apub.kr/journalsite/sites/kibim/2025-015-04/N0430150401/images/kibim_15_04_01_F4.jpg

Figure 4.

Implementation of 2D-to-3D algorithm in a visual programming environment

Table 4.

Example of 2D-to-3D Pattern modeling results and its application

Case	Style	Text prompts	Pattern images (.png)	Panel family (.rfa)	Curtain wall type application
Perforated	A	A seamless pattern, free form pattern, organic curves, asymmetric tesselation, mosaic surfaces, surrealistic, ...
Perforated	I	A seamless pattern, free form pattern, wooden gridshell, modular repetition, perforated voids, sustainability, ...* <lora:Style I:0.8>
Non- perforated	C	A seamless pattern, free form, deconstructivist, sculptural forms, undulating shapes, metallic cladding, complex geometric, ...*
Non- perforated	H	A seamless pattern, minimalist, transparent surfaces, fluid, white, layered planes, ...* <lora:Style H:0.8>

AI 생성 이미지와 자동 모델링 결과 간의 형상 정합성을 정량적으로 평가하기 위해, SSIM을 활용한 엣지 유사도 분석을 수행하였다(Wang et al., 2004). 분석 결과(Figure 5), 전체 사례의 평균 SSIM 값은 0.71로 나타났다. 수직·수평으로 구성된 패턴(Style D, 0.75)과 곡선 중심의 패턴(Style C, 0.78)에서 높은 형상 재현 성능을 보였다. 반면, 직선성이 강조된 디자인(Style F, 0.63)이나 대각선 기반의 패턴(Style H, 0.64)에서는 그리드 기반 알고리즘의 특성상 경계가 비의도적으로 곡률화되거나 왜곡이 발생하며 유사도가 상대적으로 낮게 나타났다. 그러나 SSIM 값이 낮게 나타난 사례에서도 패턴의 전반적인 조형적 인상은 유지되어, 초기 디자인 단계에서의 시각적 검토 자료로서는 충분한 활용 가치를 보였다.

https://cdn.apub.kr/journalsite/sites/kibim/2025-015-04/N0430150401/images/kibim_15_04_01_F5.jpg

Figure 5.

Example of SSIM-based edge similarity analysis

이러한 결과는 제안된 알고리즘이 패턴의 스타일에 따라 상이한 성능을 보이며, 곡률 기반 패턴에서 구조적 재현성이 높다는 점을 시사한다. 본 연구의 알고리즘은 AI가 생성한 시각적 결과물을 BIM 환경의 실제 3D 지오메트리로 자동 변환·연계함으로써, 이미지 기반 디자인 자동화의 실질적 가능성을 실험적으로 검증하였다. 특히 본 알고리즘은 정형화되지 않은 복잡한 패턴에 대해서도 일정 수준 이상의 정합도를 달성할 수 있었다. 또한 복잡하고 비정형적인 패턴에서도 일정 수준 이상의 정합도를 확보하여, 향후 알고리즘 정밀화를 통한 설계 자동화 기술의 실용성 향상 가능성을 제시한다.

5. 결 론

본 연구는 AI 기반 이미지 생성을 활용하여 자동으로 모델링을 구현하는 2D-to-3D 알고리즘을 통해, 특정 디자인 스타일이 반영된 벽체 패턴 이미지를 BIM 환경에서 바로 활용 가능한 3D 객체로 자동 변환하는 프로세스를 제안한다. 베이스 모델 및 도메인 특화 이미지 생성 AI 모델을 활용하여 약 5000장의 패턴 이미지를 생성하고, 이들중 선별된 이미지를 3D 지오메트리로 변환하여 약 200개의 패턴 객체를 생성하였다. 연구 결과, 이미지 생성의 경우, 도메인 특화 모델 구축 및 사용을 통해 스타일의 일치도는 평균 16.8%에서 67.5%로 향상되었다. 또한, 생성된 이미지를 기반으로 자동 변환된 3D 모델은 원본 이미지와 평균 0.71의 SSIM 값을 기록하며, 제안된 2D-to-3D 알고리즘이 일정 수준 이상의 시각적 정확도를 확보하였음을 확인하였다. 특히 Style C(0.78)와 같은 곡선 중심의 스타일에서 높은 정합도를 보였다.

이러한 결과는 기존의 수작업으로 이루어졌던 이미지 기반 모델링 프로세스를 자동화할 수 있음을 보여준다. 제안된 시스템은 텍스트 프롬프트로부터 생성된 이미지만으로 약 2~5분 내에 3D 모델을 생성할 수 있게 함으로써, 설계 초기 단계에서 다양한 디자인 대안을 신속하게 탐색하고 검토하는 것을 가능하게 한다. 이는 이미지 생성 AI와 BIM 설계 도구의 연계를 통해, AI가 생성한 결과물이 추상적 개념 제안에 머무르지 않고 실제 모델링 및 설계 실행 단계로 확장될 수 있음을 의미한다. 이에 본 연구는 사용자가 자체 프로젝트 데이터를 활용하여 고유의 디자인 패턴을 생성하고 3D 프로토타입 제작을 자동화할 수 있는 방법론과 가능성을 제시한 데 그 의의가 있다.

본 연구는 세 가지 측면에서 한계를 지닌다. 첫째, 이미지 생성 측면에서 생성된 이미지의 해상도가 낮거나 조명 및 그림자 표현이 비사실적인 경우, 3D 변환 과정에서 형상 정보가 부정확하게 추출되어 정합성이 저하될 수 있다. 둘째, 3D 변환 측면에서는 포인트 연결을 수직·수평 기준으로 단순화하여 구현하고 있어, 일부 복잡한 형태에서 비의도적인 왜곡이 발생하기도 한다. 또한 현재는 시각적 형태 재현에 중점을 두어, 실제 시공을 위한 구조적 조건은 반영하지 않으며, 재료 등의 일부 속성 지정은 수동적 설정에 의존한다. 셋째, 인터페이스 측면에서는 이미지 생성과 3D 모델링이 별도 프로세스로 분리되어 있어, 실시간 연동이 제한적이다.

이에 따라 향후 연구는 세 가지 방향으로 개선이 필요하다. 첫째, 이미지 생성 측면에서는 도메인 특화 AI 모델의 성능을 고도화하여, 고해상도 및 사실적인 조명 및 그림자 효과를 갖춘 이미지를 생성하는 연구가 요구된다. 둘째, 3D 변환 측면에서는 복잡한 경계와 형태를 더 정밀하게 재구성하는 알고리즘 개선과 함께, 형상적 재현을 넘어 실제 시공성 및 속성 정보 모델링까지 고려한 프로토타입을 탐색할 수 있도록 구조와 시공 정보를 반영한 알고리즘 개발이 필요하다. 셋째, 인터페이스 측면에서는 이러한 기술들을 BIM 애드인(add-in) 형태로 통합하여, 이미지 생성부터 모델 적용까지 실시간으로 연동되는 통합 설계 도구로 발전시키는 연구가 필요하다. 이를 통해 이미지 생성 AI가 제공하는 창의적 시각화와 실제 모델링 프로세스를 결합함으로써, 건축 외관 설계 전반의 자동화와 효율성을 향상시킬 수 있을 것이다.

Acknowledgements

이 논문은 2025학년도 양자컴퓨터 활용지원 사업의 지원에 의하여 작성된 것임(2025-12-0252). 이 논문(저서)은 2024년도 연세대학교 인문 사회 창의 연구 지원 사업 연구비의 지원을 받아 수행된 것임(2024-22-0568).

Notes

[1] 1) 본 연구에 사용된 이미지 품질 프롬프트는 다음과 같다: Positive prompt: close up, detail shot, a unit of pattern, large patterns, symmetric, macro details, keyshot product render, 4k, ultra high detail, ultra realism.Negative prompt: unrealistic lighting, unrealistic reflection, bad perspective, bad proportion, watermark, confusing details, blurry, noise, faint.

References

Betker, J., Goh, G., Jing, L., Brooks, T., Wang, J., Li, L., Ouyang, L., Zhuang, J., Lee, J., Guo, Y., Manassra, W., Dhariwal, P., Chu, C., Jiao, Y., Ramesh, A. (2023). Improving Image Generation with Better Captions, Computer Science, 2(3), 8.

Choi, S., Lee, J. K. (2023). Generative AI for Automated Urban Housing Floor Plan Generation, Korean Journal of Computational Design and Engineering, 28(4), pp. 514-523.

10.7315/CDE.2023.514

Dhariwal, P., Nichol, A. (2021). Diffusion Models Beat Gans on Image Synthesis, Advances in Neural Information Processing Systems, 34, pp. 8780-8794.

Goodfellow, I., Pouget-Abadie, J., Mirza, M., Xu, B., Warde- Farley, D., Ozair, S., Courville, A., Bengio, Y. (2020). Generative Adversarial Networks, Communications of the ACM, 63(11), pp. 139-144.

10.1145/3422622

Hessel, J., Holtzman, A., Forbes , M., Bras , R. L., Choi, Y. (2022). CLIP-Score: A Reference-free Evaluation Metric for Image Captioning, arXiv Preprint, arXiv:2104.08718.

10.18653/v1/2021.emnlp-main.595

Hu, E. J., Shen, Y., Wallis, P., Allen-Zhu, Z., Li, Y., Wang, S., Wang, K., Chen, W. (2021). Lora: Low-rank Adaptation of Large Language Models, arXiv Preprint, arXiv:2106.09685.

Jian, M., Yin, Y., Dong, J., Zhang, W. (2018). Comprehensive Assessment of Non-uniform Illumination for 3D Heightmap Reconstruction in Outdoor Environments Computers in Industry, 99, pp. 110–118.

10.1016/j.compind.2018.03.034

Jo, H., Lee, J. K., Lee, Y. C., Choo, S. (2024). Generative Artificial Intelligence and Building Design: Early Photorealistic Render Visualization of Façades using Local Identity-trained Models, Journal of Computational Design and Engineering, 11(2), pp. 85–105.

10.1093/jcde/qwae017

Kim, Y.-G., Lee, Y.-G., Ham, N., Kim, J.-J. (2022). BIM-based Generation of Free-form Building Panelization Model, Journal of Korean Institute of Building Information Modeling (KIBIM), 99, pp. 110–118.

Lee, J. K., Yoo, Y., Cha, S. (2024). Generative Early Architectural Visualizations: Incorporating Architect’s Style- trained Models, Journal of Computational Design and Engineering, 11(5), pp. 40-59.

10.1093/jcde/qwae065

Li, Q., Zhu, J., Liu, J., Cao, R., Fu, H., Garibaldi, J., Li, Q., Liu, B., Qiu, G. (2020). 3D Map-guided Single Indoor Image Localization Refinement. ISPRS Journal of Photogrammetry and Remote Sensing, 161, pp. 13-26.

10.1016/j.isprsjprs.2020.01.008

Liu, Y., Lin, C., Zeng, Z., Long, X., Liu, L., Komura, T., Wang, W. (2023). Syncdreamer: Generating Multiview-consistent Images from a Single-view image, arXiv preprint, arXiv:2309.03453.

Meira, P., Lopez, V. (2024). Diffusion Models for Environment Visualization: Leveraging Stable Diffusion as a Generator for Architectural Spatial Design. In Congreso Internacional de Expresión Gráfica Arquitectónica, pp. 417-426.

10.1007/978-3-031-57575-4_49

Mildenhall, B., Srinivasan, P. P., Tancik, M., Barron, J. T., Ramamoorthi, R., Ng, R. (2021). NeRF: Representing Scenes as Neural Radiance Fields for View Synthesis, Communications of the ACM, 65(1), pp. 99-106.

10.1145/3503250

OpenAI (2024). GPT-4.0 System Card arXiv preprint, arXiv:2410.21276.

Oppenlaender, J. (2022). The Creativity of Text-to-Image Generation. In Proceedings of the 25th International Academic Mindtrek Conference, pp. 192-202.

10.1145/3569219.3569352

Redweik, P. (2012). Photogrammetry. In Sciences of Geodesy -II: Innovations and Future Developments , Springer, pp. 133-183.

10.1007/978-3-642-28000-9_4

Sauer, A., Boesel, F., Dockhorn, T., Blattmann, A., Esser, P., Rombach, R. (2024). Fast High-resolution Image Synthesis with Latent Adversarial Diffusion Distillation, arXiv preprint, arXiv:2403.12015.

10.1145/3680528.3687625

Tochilkin, D., Pankratz, D., Liu, Z., Huang, Z., Letts, A., Li, Y., Liang, D., Laforte, C., Jampani, V., Cao, Y. P. (2024). TripoSR: Fast 3D Object Reconstruction from a Single Image, arXiv preprint, arXiv:2403.02151.

Wahbeh, W., Müller, G., Ammann, M., Nebiker, S. (2022). Automatic Image-based 3D Reconstruction Strategies for High-fidelity Urban Models – Comparison and Fusion of UAV and Mobile Mapping Imagery for Urban Design Studies, The International Archives of the Photogrammetry, Remote Sensing and Spatial Information Sciences, 43, pp. 461-468.

10.5194/isprs-archives-XLIII-B2-2022-461-2022

Wang, Z., Bovik, A. C., Sheikh, H. R., Simoncelli, E. P. (2004). Image Quality Assessment: From Error Visibility to Structural Similarity, IEEE Transactions on Image Processing, 13(4), pp. 600-612.

10.1109/TIP.2003.819861

Xu, Y., Li, Q., Zhao, X., Liu, D., Shi, N. (2024). The Applications of Generative Adversarial Networks in Architecture Design: A Systematic Review, Journal of Design Service and Social Innovation, 2(1), pp. 1-15.

10.59528/ms.jdssi2024.0130a14

Yang, X., Koehl, M., Grussenmeyer, P. (2018). Mesh-to-BIM: from Segmented Mesh Elements to BIM Model with Limited Parameters. The International Archives of the Photogrammetry, Remote Sensing and Spatial Information Sciences, 42, pp. 1213-1218.

10.5194/isprs-archives-XLII-2-1213-2018

Yoo, Y., Lee, J. K. (2023). Generative AI-based Construction of Architect’s Style-trained Models and its Application for Visualization of Residential Houses, Design Convergence Study, 22(6), pp. 103-116.

10.31678/SDC103.6

Yoo, Y., Lee, J. K. (2024). Generative AI-based Exterior Building Design Visualization Approach in the Early Design Stage - Leveraging Architects’ Style-trained Models -. Journal of Korean Institute of Building Information Modeling (KIBIM), 14(2), pp. 13-24.

Journal of KIBIM ISSN:2288-1697(Print) 2288-1697(Online) 한국BIM학회논문집

Preview

Automated BIM Modeling Based on AI-Generated Imagery - Focusing on Building Façade Wall Pattern Generation and Modeling -

ABSTRACT

MAIN

Figure 1.

Proposed 3D modeling automation approach

Table 1.

Hyperparameters used for fine-tuning (Yoo & Lee, 2024)

Table 2.

Parameters used for pattern image generation

Figure 2.

2D-to-3D algorithm

Table 3.

Performance comparison between base model and fine-tuned model

Figure 3.

Dataset construction process (Example of Style I)

Figure 4.

Implementation of 2D-to-3D algorithm in a visual programming environment

Table 4.

Example of 2D-to-3D Pattern modeling results and its application

Figure 5.

Example of SSIM-based edge similarity analysis

Acknowledgements

Notes

References