Trained for 1 epochs and 32000 steps.

Trained with datasets ['text-embeds-pixart-filter', 'photo-concept-bucket', 'moviecollection', 'experimental', 'ethnic', 'sports', 'architecture', 'shutterstock', 'cinemamix-1mp', 'nsfw-1024', 'anatomy', 'bg20k-1024', 'yoga', 'photo-aesthetics', 'text-1mp', 'movieposters', 'normalnudes', 'pixel-art', 'signs', 'midjourney-v6-520k-raw', 'sfwbooru', 'nijijourney-v6-520k-raw', 'dalle3']
Learning rate 1e-06, batch size 24, and 1 gradient accumulation steps.
Used DDPM noise scheduler for training with epsilon prediction type and rescaled_betas_zero_snr=False
Using 'linspace' timestep spacing.
Base model: ptx0/pixart-900m-1024-ft-large
VAE: madebyollin/sdxl-vae-fp16-fix

Files changed (14) hide show

README.md +3 -3
optimizer.bin +1 -1
random_states_0.pkl +1 -1
scheduler.bin +1 -1
training_state-anatomy.json +0 -0
training_state-bg20k-1024.json +0 -0
training_state-dalle3.json +2 -2
training_state-midjourney-v6-520k-raw.json +2 -2
training_state-nijijourney-v6-520k-raw.json +2 -2
training_state-photo-concept-bucket.json +2 -2
training_state-sfwbooru.json +0 -0
training_state-text-1mp.json +0 -0
training_state.json +1 -1
transformer/diffusion_pytorch_model.safetensors +1 -1

README.md CHANGED Viewed

@@ -62,7 +62,7 @@ You may reuse the base model text encoder for inference.
 ## Training settings
 - Training epochs: 1
-- Training steps: 31500
 - Learning rate: 1e-06
 - Effective batch size: 192
   - Micro-batch size: 24
@@ -152,7 +152,7 @@ You may reuse the base model text encoder for inference.
 ### anatomy
 - Repeats: 5
 - Total number of images: ~15168
-- Total number of aspect buckets: 2
 - Resolution: 1.0 megapixels
 - Cropped: True
 - Crop style: random
@@ -160,7 +160,7 @@ You may reuse the base model text encoder for inference.
 ### bg20k-1024
 - Repeats: 0
 - Total number of images: ~89088
-- Total number of aspect buckets: 1
 - Resolution: 1.0 megapixels
 - Cropped: True
 - Crop style: random

 ## Training settings
 - Training epochs: 1
+- Training steps: 32000
 - Learning rate: 1e-06
 - Effective batch size: 192
   - Micro-batch size: 24
 ### anatomy
 - Repeats: 5
 - Total number of images: ~15168
+- Total number of aspect buckets: 3
 - Resolution: 1.0 megapixels
 - Cropped: True
 - Crop style: random
 ### bg20k-1024
 - Repeats: 0
 - Total number of images: ~89088
+- Total number of aspect buckets: 3
 - Resolution: 1.0 megapixels
 - Cropped: True
 - Crop style: random

optimizer.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:6a58fd4d292f728e09b7fc8b1f13d99526fa19749b0520f0f5f2478a0108b511
 size 5451415117

 version https://git-lfs.github.com/spec/v1
+oid sha256:b26e89cf7c5bf30683b62e3f3dbe6ae5ca374596fa0d9f32c34b9a2508fc7353
 size 5451415117

random_states_0.pkl CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:eefb07561d681e1f10e9ddc194312a71784689f194f637383ce8b160724d190f
 size 16100

 version https://git-lfs.github.com/spec/v1
+oid sha256:e042327144872bf5c2eac3f3ee6caac9d6b4e8510717aec903c2d0c0b77806be
 size 16100

scheduler.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:064acec7018bfb3b53d575594c3395db946d92b017d70e3077018412027181f9
 size 1000

 version https://git-lfs.github.com/spec/v1
+oid sha256:4cb70fd226b713f887d06091e6e1b1235e485cff839e044caf29c71266df6b36
 size 1000

training_state-anatomy.json CHANGED Viewed

The diff for this file is too large to render. See raw diff

training_state-bg20k-1024.json CHANGED Viewed

The diff for this file is too large to render. See raw diff

training_state-dalle3.json CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:c5584cad5eec26dd2cb9b9f19ac05525839b73d3d967ce57fab2a352c0052fa8
-size 9578444

 version https://git-lfs.github.com/spec/v1
+oid sha256:b056132b2d30f580155feb834cf009dc813f67df0e77b08d1cc2b88a5fae74eb
+size 9694482

training_state-midjourney-v6-520k-raw.json CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:52a6a51fd6088d3c8dd49616e420f171879330691e72aaa84cd35b6b1d4ee2c7
-size 7321095

 version https://git-lfs.github.com/spec/v1
+oid sha256:95f96ea79085b0e1d98090be7cb0507687b5732ad96d3da567d1218ad398cc94
+size 7501551

training_state-nijijourney-v6-520k-raw.json CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:e1ba8579275b5be64e3432f429f6efea56ac2b1294c2c17ecb4f447d18fd5c49
-size 7795171

 version https://git-lfs.github.com/spec/v1
+oid sha256:041abfe0c94192dacfa7274840e44cebeeb945b4046fd64d591b7a74b1c24a10
+size 7964131

training_state-photo-concept-bucket.json CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:da1873dde2801df1b3488cf372e416491f2b6e7834a5958574af25cd24710906
-size 6020196

 version https://git-lfs.github.com/spec/v1
+oid sha256:2d043e6834fc6f505dcb52414deede20d21eea4a97f29aea59bae95570dc902c
+size 6151948

training_state-sfwbooru.json CHANGED Viewed

The diff for this file is too large to render. See raw diff

training_state-text-1mp.json CHANGED Viewed

The diff for this file is too large to render. See raw diff

training_state.json CHANGED Viewed

@@ -1 +1 @@

- {"global_step": ~~31500~~, "epoch_step": 1, "epoch": 2, "exhausted_backends": ["pixel-art", "signs", "sports", "ethnic", "experimental", "movieposters", "normalnudes", "yoga", "cinemamix-1mp", "architecture", "moviecollection", "shutterstock", "nsfw-1024", "photo-aesthetics"], "repeats": {"bookcovers": 0, "signs": 0, "normalnudes": 0, "nijijourney": 0, "movieposters": 0, "celebrities": 0, "pixel-art": 0, "propagandaposters": 0, "sports": 0, "moviecollection": 0, "gay": 0, "experimental": 0, "yoga": 0, "ethnic": 0, "cinemamix-1mp": 0, "architecture": 0, "mj-60": 0, "text-1mp": 6, "shutterstock": 0, "nsfw-1024": 0, "photo-aesthetics": 0, "anatomy": 2, "bg20k-1024": 0, "sfwbooru": 0, "midjourney-v6-520k-raw": 0, "nijijourney-v6-520k-raw": 0, "photo-concept-bucket": 0, "dalle3": 0}}

+ {"global_step": 32000, "epoch_step": 1, "epoch": 2, "exhausted_backends": ["pixel-art", "signs", "sports", "ethnic", "experimental", "movieposters", "normalnudes", "yoga", "cinemamix-1mp", "architecture", "moviecollection", "shutterstock", "nsfw-1024", "photo-aesthetics", "bg20k-1024"], "repeats": {"bookcovers": 0, "signs": 0, "normalnudes": 0, "nijijourney": 0, "movieposters": 0, "celebrities": 0, "pixel-art": 0, "propagandaposters": 0, "sports": 0, "moviecollection": 0, "gay": 0, "experimental": 0, "yoga": 0, "ethnic": 0, "cinemamix-1mp": 0, "architecture": 0, "mj-60": 0, "text-1mp": 7, "shutterstock": 0, "nsfw-1024": 0, "photo-aesthetics": 0, "anatomy": 3, "bg20k-1024": 0, "sfwbooru": 0, "midjourney-v6-520k-raw": 0, "nijijourney-v6-520k-raw": 0, "photo-concept-bucket": 0, "dalle3": 0}}

transformer/diffusion_pytorch_model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:5e13e1dcf8be431518a4ee86aa82eb258c1955c938c10bccdc4900f839868e1f
 size 1816969728

 version https://git-lfs.github.com/spec/v1
+oid sha256:f43cff97a8a9b93c08334997247983eab5115d5748fc0853d814a6703723d3bd
 size 1816969728