안녕하세요, Scenic입니다. 시댄스로 전투 장면을 만들어 보셨나요? 캐릭터가 움직이긴 하는데 뭔가 어색하고, 카메라가 멈춰 있거나 임팩트가 없다고 느끼신 분들 많을 거예요. 프롬프트가 "싸우는 장면"이라고만 쓰면 실제로 어떻게 싸우는지, 카메라는 어디서 어떻게 따라가는지 AI가 판단하기 어렵거든요.
이번 포스트에서는 시댄스로 실제로 생성된 전투 장면 프롬프트 다섯 가지를 뜯어봤어요. 레트로 쿵푸부터 포스트 아포칼립스 보스전까지, 각 장르별로 어떤 언어가 장면을 살아있게 만드는지 공유할게요.
1. 80년대 차고 쿵푸 — 레트로 액션
"A fast-paced kung fu fight in a cramped garage, 80s action cinema style, grounded and physical. One protagonist faces 3 attackers, using improvised objects (chair and ladder) with fluid movement."
이 프롬프트가 잘 작동하는 이유는 장르 레퍼런스를 명확히 못 박기 때문이에요. "80s action cinema style"이라는 한 마디가 과장된 CG 없이 몸으로 부딪히는 그 특유의 질감을 가이드해요. 시댄스는 스타일 태그에 민감하게 반응하기 때문에, 어떤 영화 시대의 액션을 원하는지 명시하면 결과물이 크게 달라져요.
짧은 프롬프트임에도 "cramped garage"(공간 제약), "improvised objects"(즉흥 무기), "3 attackers"(수적 열세)가 모두 담겨 있어요. 전투의 조건과 제약을 설정하는 것이 단순히 "싸움" 장면을 묘사하는 것보다 훨씬 구체적인 결과를 만들어 내는 핵심 기법이에요.
2. 웨이트리스의 반격 — 어반 클로즈업 액션
"Cinematic-quality visuals, a spacious vintage grocery store (neon lights reflected on the glass display window, warm and cold lights intertwined). Subject: A beautiful waitress, very elegant and with a determined look. Action: Two armed robbers confront the waitress, one robber is nervously looking around, pointing a gun at the waitress's head..."
이 프롬프트의 강점은 감정선의 흐름을 행동으로 번역했다는 점이에요. "pretending to be scared"에서 갑작스러운 반격으로 이어지는 전환이 명시되어 있어서, 시댄스가 단순 격투가 아니라 서사가 있는 액션을 만들어요. 조명 묘사(neon lights, warm and cold intertwined)는 장면의 분위기를 그냥 "멋있게"가 아니라 구체적인 색 온도로 안내해요.
카메라 지시어도 잘 설계되어 있어요. "Handheld camera style, rapid shaking, focus switching"으로 움직임 자체에 긴장감이 생기고, "tense static shots → chaotic close-up follow shots"처럼 촬영 흐름의 변화를 써주면 AI가 단조롭지 않은 편집 리듬을 구현할 수 있어요.
3. 은행 강도 속 요원 — 건파이팅
"Character A highly trained female operative in a sleek black tactical suit, calm, focused, controlled breathing, sharp eyes scanning constantly. Dual pistols in hand, precise and efficient. 0-3s Camera starts inside a luxury bank. Slow push through a tense standoff—security guards aiming, civilians frozen. She stands in the center, perfectly still..."
타임코드 구조가 이 프롬프트를 특별하게 만들어요. "0-3s", "3-5s"처럼 초 단위로 장면을 나눠 기술하면 시댄스가 한 시퀀스 안에서 템포 변화를 정확히 반영해요. 정적인 긴장감으로 시작해 폭발적인 움직임으로 넘어가는 구조를 AI가 임의로 해석하지 않고 그대로 따라가요.
캐릭터 묘사도 주목할 만해요. 외형이 아니라 "controlled breathing, no wasted motion"처럼 움직임의 질을 묘사하는 언어가 John Wick식의 절제된 건파이팅을 만들어요. 시댄스에서 캐릭터의 전투 스타일을 정의할 때는 외모보다 동작의 성격을 먼저 기술하는 게 효과적이에요.
4. 오피스 난투극 — 원테이크 근접전
"15-second, no-dialogue, fully immersive high-speed brutal fight short film. Two characters. Live-action realistic style. Close-quarters, high-speed chaotic melee combat with no rules, fully out-of-control brawling. No flashy choreography—pure raw. Continuous exchange of punches, kicks, blocks, body checks, throws..."
"No flashy choreography—pure raw"이라는 지시어가 이 프롬프트의 핵심이에요. 영화 액션의 공식적인 안무를 배제하고 실제 싸움처럼 엉키는 장면을 원할 때, 금지어 방식으로 접근하는 게 생각보다 강력하게 작동해요. 무엇을 원한다는 것보다 무엇을 원하지 않는다는 것을 명시하면 AI의 해석 폭이 좁아져요.
환경 설정도 정밀해요. "Modern open-plan office, desks, computers, cabinets, no glass-breaking"처럼 오브젝트와 함께 파괴 제한 조건까지 써줬어요. 이 디테일이 단순 난투를 실제 직장 공간에서 벌어지는 치밀한 격투로 만들고, "Final 2-3s: deadlock"이라는 클라이막스 설계로 장면이 열린 결말로 끝나도록 해요.
5. 황무지 여전사 대 보스 — 포스트 아포칼립스 액션
"SUBJECTS: A female post-apocalyptic future warrior, short hair pressed backward by high-speed airflow, face marked with dust and fine scars; wearing layered wasteland tactical gear: a tight heat-resistant inner layer + a damaged outer drape with hanging straps, partially embedded ceramic armor plates with scorched edges; one arm is a mechanical prosthetic..."
캐릭터 묘사의 밀도가 다른 프롬프트와 차원이 달라요. 복장 레이어, 재질, 손상 정도까지 명시된 이 수준의 기술이 VFX 스타일의 결과물을 만들어요. 특히 "ceramic armor plates with scorched and worn edges"처럼 마모 상태까지 쓰면 AI가 그 세계의 시간적 맥락까지 반영해요.
색 로직(COLOR LOGIC) 섹션이 이 프롬프트만의 특징이에요. "Overall low-saturation cold gray-blue environment; the fissure-flame spear is the only high-brightness warm color"처럼 의도적으로 색 대비를 설계하면 화면 전체의 시선 동선이 제어돼요. 복잡한 전투 장면에서 어디를 봐야 할지를 색으로 안내하는 이 기법은 장면의 완성도를 크게 높여요.
전투 장면 프롬프트의 공통 법칙
다섯 개 프롬프트를 비교해 보면 공통된 패턴이 보여요.
첫째, 장르 레퍼런스를 명시해요. "80s cinema style", "John Wick gun-fu", "live-action realistic"처럼 어떤 전통의 액션인지 못 박으면 결과물의 방향이 잡혀요.
둘째, 타임코드나 단계로 시퀀스를 분절해요. 15초 영상을 통짜로 기술하면 AI가 임의로 해석해요. 초 단위 또는 행동 단계로 나눠 기술하면 원하는 템포 변화가 반영돼요.
셋째, 카메라 운동을 행동과 동시에 설계해요. "Camera orbiting as she moves", "handheld rapid shaking"처럼 촬영 방식을 장면 안에서 함께 기술하면 단조로운 고정 카메라를 피할 수 있어요.
직접 만들어 보고 싶으시다면 scenic.sh에서 각 프롬프트 원문을 확인하고 바로 생성해 보세요.