Yapay Zeka Görüntüleri Oluşturmak için Bilgisayarınızda Kararlı Difüzyon Nasıl Çalıştırılır?

Yapay zeka tarafından üretilmiş sihirli bir sincap, sanatsal Mısır akbabası ve bir çöl üzerinde dramatik bir ayın doğuşu. Başlık görüntü.

Stable Diffusion'ı PC'nizde yerel olarak çalıştırmak için GitHub'dan Stable Diffusion'ı ve HuggingFace.co'dan en son kontrol noktalarını indirin ve kurun. Ardından, Miniconda kullanarak özel bir python ortamında Stable Difüzyonu çalıştırın.

Devamını Oku

Yapay Zeka (AI) sanatı şu anda çok revaçta, ancak çoğu AI görüntü oluşturucu bulutta çalışıyor. Kararlı Difüzyon farklıdır — kendi PC'nizde çalıştırabilirsiniz ve istediğiniz kadar görüntü oluşturun. Stable Difusion'ı şu şekilde kurabilir ve kullanabilirsiniz: Windows.

Kararlı Difüzyon Nedir?

Kararlı Difüzyon, açık kaynaklı bir makine öğrenimi modelidir metinden görüntüler oluşturabilen, metne dayalı olarak görüntüleri değiştirebilen veya düşük çözünürlüklü veya düşük detaylı görüntülerde ayrıntıları doldurabilen. Milyarlarca görüntü üzerinde eğitilmiştir ve DALL-E 2'den alacağınız sonuçlarla karşılaştırılabilir sonuçlar üretebilir ve Orta Yolculuk. tarafından geliştirildi Stabilite AI ve ilkti halka açık Ağustos 22, 2022 üzerinde.

Stable Diffusion, bazı AI görüntü oluşturucular gibi (henüz) düzenli bir kullanıcı arayüzüne sahip değildir, ancak son derece izin verici bir lisansa sahiptir ve - en iyisi - kendi PC'nizde (veya Mac'inizde) kullanmak tamamen ücretsizdir.

Stable Diffusion'ın şu anda bir komut satırı arabiriminde (CLI) çalıştığı gerçeği gözünüzü korkutmasın. Çalıştırmak ve çalıştırmak oldukça basittir. Yürütülebilir bir dosyaya çift tıklayıp bir kutuya yazabilirseniz, onu birkaç dakika içinde çalıştırabilirsiniz.

PC'nizde Kararlı Difüzyon Çalıştırmak için Neye İhtiyacınız Var?

Stable Difüzyon, telefonunuzda veya çoğu dizüstü bilgisayarda çalışmaz, ancak 2022'de ortalama bir oyun bilgisayarında çalışır. Gereksinimler şunlardır:

Donanımınız yoksa, düşünün web tabanlı bir yapay zeka görüntü oluşturucu kullanarak. koşabilirsin bile Kararlı Difüzyon demosu internette.

Stabil Difüzyon Nasıl Kurulur ve Çalıştırılır? Windows

İhtiyacınız olan iki yazılım parçası vardır: Git ve Miniconda3.

Not: Git ve Miniconda3, saygın kuruluşlar tarafından üretilen güvenli programlardır. Bu makalede bağlantısı verilen resmi kaynaklardan indirmeniz koşuluyla, onlarla birlikte kötü amaçlı yazılım konusunda endişelenmenize gerek yoktur.

Git'i Yükleme

Git geliştiricilerin geliştirmekte oldukları yazılımın farklı sürümlerini yönetmelerini sağlayan bir araçtır. Aynı anda merkezi bir havuzda üzerinde çalıştıkları yazılımın birden fazla sürümünü tutabilir ve diğer geliştiricilerin projeye katkıda bulunmasına izin verebilirler.

Geliştirici değilseniz, Git bu projelere erişmek ve indirmek için uygun bir yol sağlar ve bu durumda onu bu şekilde kullanacağız. Atomic Cüzdanı indirin : Windows x64 yükleyici Git web sitesinden, ardından şuraya çalıştırın: Git'i yükle.

Yükleyici çalışırken seçmeniz istenecek birkaç seçenek vardır; bunları varsayılan ayarlarında bırakın. Bir seçenek sayfası olan "PATH Ortamınızı Ayarlama" özellikle önemlidir. "Komut Satırından Ve Ayrıca 3. Parti Yazılımlardan Git" olarak ayarlanmalıdır.

"Komut Satırından ve Ayrıca 3. Taraf Yazılımdan Git" seçeneğinin seçili olduğundan emin olun.

Miniconda3'ü Yükleme

Kararlı Difüzyon birkaç farklı çeker Python kitaplıkları. Python hakkında fazla bir şey bilmiyorsanız, bu konuda endişelenmeyin - kitaplıkların, bilgisayarınızın bir görüntüyü dönüştürmek veya karmaşık matematik yapmak gibi belirli işlevleri gerçekleştirmek için kullanabileceği yazılım paketleri olduğunu söylemek yeterli.

Miniconda3 temel olarak bir kolaylık aracıdır. Stable Diffusion'ın çok fazla manuel müdahale olmadan çalışması için gereken tüm kitaplıkları indirmenize, kurmanıza ve yönetmenize olanak tanır. Kararlı Difüzyonu gerçekte nasıl kullandığımız da bu olacaktır.

Başının üzerinde Miniconda3 indirme sayfası tıklayın ve “Miniconda3 Windows 64-bit” en son yükleyiciyi almak için.

miniconda3 64bit

Yüklemeyi başlatmak için indirildikten sonra yürütülebilir dosyaya çift tıklayın. Miniconda3'ün kurulumu, Git'in yaptığından daha az sayfa tıklamayı içerir, ancak bu seçeneğe dikkat etmeniz gerekir:

yazan kutucuğu işaretleyin

İleri'ye tıklayıp kurulumu tamamlamadan önce "Tüm Kullanıcılar"ı seçtiğinizden emin olun.

Git ve Miniconda3'ü yükledikten sonra bilgisayarınızı yeniden başlatmanız istenecektir. Biz bunu gerekli bulmadık ama bulursanız zararı olmaz.

Kararlı Difüzyon GitHub Deposunu ve En Son Kontrol Noktasını İndirin

Artık ön gerekli yazılımı yüklediğimize göre, Stable Diffusion'ı indirip yüklemeye hazırız.

En son kontrol noktasını indirin ilk - sürüm 1.4 yaklaşık 5 GB, bu yüzden biraz zaman alabilir. Kontrol noktasını indirmek için bir hesap oluşturmanız gerekir, ancak bunlar için yalnızca bir ad ve e-posta adresi gerekir. Diğer her şey isteğe bağlıdır.

Not: Yazma sırasında (2 Eylül 2022), en son kontrol noktası sürüm 1.4'tür. Daha yeni bir sürüm varsa, onu indirin.

model erişimi

İndirmeyi başlatmak için “sd-v1-4.ckpt”ye tıklayın.

Not: Diğer dosya “sd-v1-4-full-ema.ckpt”, olabilir daha iyi sonuçlar sağlar, ancak boyutun yaklaşık iki katıdır. İkisinden birini kullanabilirsiniz.

sd v1 4'ü tıklayın

Sonra ihtiyacın var Kararlı Difüzyonu indir GitHub'dan. Yeşil “Kod” düğmesine ve ardından “ZIP İndir” seçeneğine tıklayın. Alternatif olarak, kullanabilirsiniz bu doğrudan indirme bağlantısı.

kodu tıklayın, ZIP'i indirin

Şimdi tüm Stable Diffusion dosyalarını açacağımız birkaç klasör hazırlamamız gerekiyor. Başlat düğmesine tıklayın ve Başlat Menüsü arama çubuğuna “miniconda3” yazın, ardından “Aç”a tıklayın veya Enter tuşuna basın.

başlat tıkla aç

Komut satırını kullanarak “stable-diffusion” isimli bir klasör oluşturacağız. Aşağıdaki kod bloğunu kopyalayıp Miniconda3 penceresine yapıştırın, ardından Enter tuşuna basın.

cd C:/ mkdir kararlı yayın cd kararlı yayın

Not: Miniconda3 gibi bir terminale neredeyse her kod bloğu yapıştırdığınızda, son komutu çalıştırmak için sonunda Enter tuşuna basmanız gerekir.

Her şey yolunda giderse, şöyle bir şey görürsünüz:

Başarıyla yürütülen komutları gösteren Minoconda3 terminali.

Miniconda3 penceresini açık tutun, birazdan tekrar ihtiyacımız olacak.

GitHub'dan indirdiğiniz "stable-diffusion-main.zip" adlı ZIP dosyasını açın. favori dosya arşivleme programı. Alternatif olarak, Windows ZIP dosyalarınız yoksa kendi başına da açabilir. ZIP dosyasını bir pencerede açık tutun, ardından başka bir pencere açın dosya Gezgini penceresini açın ve az önce oluşturduğumuz “C:stable-diffusion” klasörüne gidin.

ZIP dosyasındaki "stable-diffusion-main" klasörünü "stable-diffusion" klasörüne sürükleyip bırakın.

ZIP dosyasının içeriğini kararlı difüzyon klasörüne sürükleyip bırakın.

Miniconda3'e geri dönün, ardından aşağıdaki komutları kopyalayıp pencereye yapıştırın:

cd C:kararlı-difüzyonkararlı-difüzyon-ana conda env create -f ortamı.yaml conda aktiv ldm mkdir modellerildmstable-difüzyon-v1

İndirmenin bitmesini bekleyin.

Bu işlemi yarıda kesmeyin. Dosyalardan bazıları bir gigabayttan daha büyük olduğundan, indirilmeleri biraz zaman alabilir. İşlemi yanlışlıkla keserseniz, ortam klasörünü silmeniz ve çalıştırmanız gerekir. conda env create -f environment.yaml Yeniden. Böyle bir durumda, “C:Users(Kullanıcı Hesabınız).condaenvs”ye gidin ve “ldm” klasörünü silin, ardından önceki komutu çalıştırın.

Not: Peki az önce ne yaptık? Python, kodlama projelerini "Ortamlar" olarak sıralamanıza olanak tanır. Her ortam diğer ortamlardan ayrıdır, bu nedenle farklı Python kitaplıklarını, çakışan sürümler hakkında endişelenmenize gerek kalmadan farklı ortamlara yükleyebilirsiniz. Bir PC'de birden fazla proje üzerinde çalışıyorsanız, paha biçilmezdir.

Çalıştırdığımız satırlar, indirilen ve kurulan "ldm" adlı yeni bir ortam oluşturdu. Stable Difusion'ın çalışması için gerekli tüm Python kitaplıklarıldm ortamını etkinleştirdi, ardından dizini değiştirdi yeni bir klasöre.

Kurulumun son aşamasındayız. Dosya Gezgini'nde "C:stable-diffusionstable-diffusion-mainmodelsldmstable-diffusion-v1" konumuna gidin, ardından kontrol noktası dosyasını (sd-v1-4.ckpt) kopyalayıp klasöre yapıştırın.

Model dosyasını stable-diffuse-v1 klasörüne kopyalayın.

Dosya aktarımının bitmesini bekleyin, “sd-v1-4.ckpt”ye sağ tıklayın ve ardından “Yeniden Adlandır”a tıklayın. Vurgulanan kutuya “model.ckpt” yazın, ardından dosya adını değiştirmek için Enter tuşuna basın.

Not: Eğer koşuyorsan Windows 11, sağ tıklama bağlam menüsünde “yeniden adlandır” görmezsiniz. Bunun yerine minyatür bir metin alanına benzeyen bir simge var.

Model dosyasını yeniden adlandırın

Ve işte bu kadar - işimiz bitti. Artık Kararlı Difüzyonu fiilen kullanmaya hazırız.

Kararlı Difüzyon Nasıl Kullanılır?

Yarattığımız ldm ortamı çok önemlidir ve Stable Difusion'ı kullanmak istediğinizde onu etkinleştirmeniz gerekir. Girmek conda activate ldm Miniconda3 penceresine girin ve "Enter" tuşuna basın. Sol taraftaki (ldm), ldm ortamının aktif olduğunu gösterir.

Not: Bu komutu yalnızca Miniconda3'ü açtığınızda girmeniz gerekir. Pencereyi kapatmadığınız sürece ldm ortamı aktif kalacaktır.

ldm ortamını etkinleştirin.

O zaman dizini değiştirmeliyiz (böylece komutcd) herhangi bir görüntü oluşturabilmemiz için "C:stable-difüzyonstable-difüzyon-ana"ya. Yapıştırmak cd C:stable-diffusionstable-diffusion-main komut satırına.

Kararlı Difüzyonla Görüntü Nasıl Yapılır

Metin istemlerini 2×512 görüntülere dönüştürmemizi sağlayan txt512img.py adlı bir betiği arayacağız. İşte bir örnek. Her şeyin doğru çalıştığından emin olmak için şunu deneyin:

python scripts/txt2img.py --prompt "pablo picasso'dan bir kedinin yakın plan portresi, canlı, soyut sanat, renkli, canlı" --plms --n_iter 5 --n_samples 1

Konsolunuz resimleri üretirken size bir ilerleme göstergesi verecektir.

Kararlı Difüzyon oluşturan görüntüler.

Bu komut, tümü "C:stable-diffusionstable-diffusion-mainoutputstxt2img-samplessamples" konumunda bulunan beş kedi görüntüsü üretecektir.

Pablo Picasso tarzında bir kedi.

Mükemmel değil ama istemde belirttiğimiz gibi Pablo Picasso'nun stilini açıkça andırıyor. Resimleriniz benzer görünmelidir, ancak aynı olması gerekmez.

Hangi görüntünün oluşturulduğunu değiştirmek istediğinizde, aşağıdaki çift tırnak işaretlerinin içerdiği metni değiştirmeniz yeterlidir. --prompt.

Bahşiş: Her seferinde tüm satırı yeniden yazmayın. Metin imlecini hareket ettirmek için ok tuşlarını kullanın ve sadece istemi değiştirin.

python komut dosyaları/txt2img.py --prompt"SİZİN, AÇIKLAMALAR, GO, BURAYA" --plms --n_iter 5 --n_örnekler 1

Sihirli bir ormanda büyücü şapkası takan gerçekçi görünümlü bir sincap yaratmak istediğimizi varsayalım. Şu komutu deneyebiliriz:

python scripts/txt2img.py --prompt "ormanda büyücü şapkası takan bir sincap fotoğrafı, canlı, fotogerçekçi, büyülü, fantezi, 8K UHD, fotoğrafçılık" --plms --n_iter 5 --n_samples 1

Mor büyücü şapkalı bir sincap.

Gerçekten bu kadar kolay - sadece ne istediğinizi olabildiğince spesifik olarak tanımlayın. Fotogerçekçi bir şey istiyorsanız, gerçekçi bir görüntüyle ilgili terimleri eklediğinizden emin olun. Belirli bir sanatçının stilinden ilham alan bir şey istiyorsanız, sanatçıyı belirtin.

Stable Difusion yalnızca portreler ve hayvanlarla sınırlı değildir, aynı zamanda çarpıcı manzaralar da oluşturabilir.

Etrafında dağlar ve dramatik bir gökyüzü olan sakin bir göl.

Komuttaki Argümanlar Ne Anlama Geliyor?

Kararlı Difüzyon, sonuçlarınızı özelleştirmek için sağlayabileceğiniz çok sayıda ayar ve bağımsız değişkene sahiptir. Burada yer alan birkaç tanesi, Stable Diffusion'ın ortalama bir oyun bilgisayarında çalışmasını sağlamak için temel olarak gereklidir.

  • –plms — Görüntülerin nasıl örnekleneceğini belirtir. Bununla ilgili bir makale var, matematiği kontrol etmek istersen.
  • –n_iter — her bilgi istemi için oluşturmak istediğiniz yineleme sayısını belirtir. 5, ne tür sonuçlar aldığınızı görmek için iyi bir sayıdır.
  • –n_samples — üretilecek örnek sayısını belirtir. Varsayılan 3'tür, ancak çoğu bilgisayarda bunu desteklemek için yeterli VRAM yoktur. Değiştirmek için özel bir nedeniniz yoksa 1'e sadık kalın.

Tabii ki, Kararlı Difüzyon, sonuçlarınızı değiştirmek için uygulayabileceğiniz tonlarca farklı argümana sahiptir. Koşmak python scripts/txt2img.py --help kullanabileceğiniz bağımsız değişkenlerin kapsamlı bir listesini almak için.

Harika sonuçlar elde etmek için bir ton deneme yanılma vardır, ancak bu, eğlencenin en az yarısıdır. Beğendiğiniz sonuçları döndüren argümanları ve açıklamaları yazdığınızdan veya kaydettiğinizden emin olun. Tüm deneyleri kendiniz yapmak istemiyorsanız, büyüyen Reddit'teki topluluklar (ve başka yerlerde) resim ve onları oluşturan bilgi istemlerini değiş tokuş etmeye adanmıştır.

Orijinal Makale

Ilgili mesajlar