code for 30 trials, 75 tests per

alexandriapawlik · alexandriapawlik · commit a2e9edc9b6b6 · 2020-05-07T15:19:13.000-04:00
diff --git a/1_each_client_partially_iid.py b/1_each_client_partially_iid.py
@@ -146,7 +146,7 @@ def go(self, num, batch):
 			# assign slices to single client
 			dataset = tf.data.Dataset.from_tensor_slices((client_sample_x, client_sample_y))
 			# add to list of client datasets
-			self.dataset_list.append(dataset.repeat(self.NUM_EPOCHS).batch(self.BATCH_SIZE).shuffle(self.SHUFFLE_BUFFER))
+			self.dataset_list.append(dataset.repeat(self.NUM_EPOCHS).batch(self.BATCH_SIZE).shuffle(60000, seed = self.SHUFFLE_SEED, reshuffle_each_iteration=True))
 
 		# train
 		self.build_model()
diff --git a/2_some_clients_iid.py b/2_some_clients_iid.py
@@ -98,7 +98,7 @@ def go(self, num, batch):
 			# assign slices to single client
 			dataset = tf.data.Dataset.from_tensor_slices((client_sample_x, client_sample_y))
 			# add to list of client datasets
-			self.dataset_list.append(dataset.repeat(self.NUM_EPOCHS).batch(self.BATCH_SIZE).shuffle(self.SHUFFLE_BUFFER))
+			self.dataset_list.append(dataset.repeat(self.NUM_EPOCHS).batch(self.BATCH_SIZE).shuffle(60000, seed = self.SHUFFLE_SEED, reshuffle_each_iteration=True))
 
 		# train
 		self.build_model()
diff --git a/3_shard.py b/3_shard.py
@@ -109,7 +109,7 @@ def go(self, num, batch):
 			# assign slices to single client
 			dataset = tf.data.Dataset.from_tensor_slices((client_sample_x, client_sample_y))
 			# add to list of client datasets
-			self.dataset_list.append(dataset.repeat(self.NUM_EPOCHS).batch(self.BATCH_SIZE).shuffle(self.SHUFFLE_BUFFER))
+			self.dataset_list.append(dataset.repeat(self.NUM_EPOCHS).batch(self.BATCH_SIZE).shuffle(60000, seed = self.SHUFFLE_SEED, reshuffle_each_iteration=True))
 
 		# train
 		self.build_model()
diff --git a/4_iid.py b/4_iid.py
@@ -48,7 +48,7 @@ def go(self, num, batch):
 			# slice data for single client
 			dataset = tf.data.Dataset.from_tensor_slices((x_train[x_indices], y_train[y_indices])) 
 			# add to list of client datasets
-			self.dataset_list.append(dataset.repeat(self.NUM_EPOCHS).batch(self.BATCH_SIZE).shuffle(self.SHUFFLE_BUFFER))  
+			self.dataset_list.append(dataset.repeat(self.NUM_EPOCHS).batch(self.BATCH_SIZE).shuffle(60000, seed = self.SHUFFLE_SEED, reshuffle_each_iteration=True))  
 
 		# train
 		self.build_model()
diff --git a/config.JSON b/config.JSON
@@ -3,7 +3,7 @@
 		"COHORT_SIZE": 5,
 		"NUM_LOCAL_EPOCHS": 10,
 		"LOCAL_BATCH_SIZE": 10,
-		"SHUFFLE_BUFFER": 100,
+		"SHUFFLE_SEED": 100,
 		"LEARNING_RATE": 0.215,
 		"TARGET_ACCURACY": 99,
 		"ROUNDS_BETWEEN_TESTS": 1
diff --git a/partitioner.py b/partitioner.py
@@ -24,7 +24,7 @@ def __init__(self):
 		self.MAX_FANOUT = 1
 		self.NUM_EPOCHS = 1
 		self.BATCH_SIZE = 1
-		self.SHUFFLE_BUFFER = 0
+		self.SHUFFLE_SEED = 0
 		self.LR = 0.1
 		self.TARGET = 50
 		self.TEST_PERIOD = 1
@@ -62,7 +62,7 @@ def prep(self):
 			self.MAX_FANOUT = math.ceil(options['system']['MAX_THREADS'])  # controlls multi-threading
 			self.NUM_EPOCHS = math.ceil(options['model']['NUM_LOCAL_EPOCHS'])  # for client model
 			self.BATCH_SIZE = math.ceil(options['model']['LOCAL_BATCH_SIZE'])  # for client model
-			self.SHUFFLE_BUFFER = math.ceil(options['model']['SHUFFLE_BUFFER'])
+			self.SHUFFLE_SEED = math.ceil(options['model']['SHUFFLE_SEED'])
 			self.LR = options['model']['LEARNING_RATE']  # SGD learning rate
 			self.TARGET = options['model']['TARGET_ACCURACY'] # target accuracy for model when tested with test set
 			self.TEST_PERIOD = options['model']['ROUNDS_BETWEEN_TESTS'] # number of rounds between testset evaluation
@@ -97,16 +97,16 @@ def test_num(self, n):
 
 			# construct value array
 			# learning rate chosen/iterates first, batch size second, ...
-			shuffle_buffer = [100, 200, 300, 400, 500, 600, 700, 800]
-			percent_data_iid = [0, 20, 40, 60, 80, 100]  # schema 1
+			shuffle_seed = list(range(30))
+			percent_data_iid = [20, 40, 60, 80, 100]  # schema 1
 			percent_clients_iid = [50]  # schema 2
-			cohort_size = [2, 5, 10, 15, 20, 25, 30] 
+			cohort_size = [2, 5, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 35, 40] 
 			num_epochs = [10]  # leave at 10
 			batch_size = [10]
 			learning_rate = [0.1]
 
 			# convert test number to array indices and set constants to array values
-			self.SHUFFLE_BUFFER = shuffle_buffer[n // (len(percent_data_iid) * len(percent_clients_iid) * len(cohort_size) * len(num_epochs) * len(batch_size) * len(learning_rate))]
+			self.SHUFFLE_SEED = shuffle_seed[n // (len(percent_data_iid) * len(percent_clients_iid) * len(cohort_size) * len(num_epochs) * len(batch_size) * len(learning_rate))]
 			n = n % (len(percent_data_iid) * len(percent_clients_iid) * len(cohort_size) * len(num_epochs) * len(batch_size) * len(learning_rate))
 			self.PERCENT_DATA_IID = percent_data_iid[n // (len(percent_clients_iid) * len(cohort_size) * len(num_epochs) * len(batch_size) * len(learning_rate))]
 			n = n % (len(percent_clients_iid) * len(cohort_size) * len(num_epochs) * len(batch_size) * len(learning_rate))
@@ -132,11 +132,11 @@ def make_config_csv(self, test, batch):
 		filename = 'results/' + str(batch) + '/' + str(batch) + '.' + str(test) + '.config.csv'
 		with open(filename, 'w', newline='') as csvfile:
 			writer = csv.writer(csvfile, delimiter=',', quotechar='|', quoting=csv.QUOTE_MINIMAL)
-			writer.writerow(['COHORT_SIZE', 'NUM_LOCAL_EPOCHS', 'LOCAL_BATCH_SIZE', 'SHUFFLE_BUFFER', 
+			writer.writerow(['COHORT_SIZE', 'NUM_LOCAL_EPOCHS', 'LOCAL_BATCH_SIZE', 'SHUFFLE_SEED', 
 				'LEARNING_RATE', 'TARGET_ACCURACY', 'ROUNDS_BETWEEN_TESTS', 'NUM_CLIENTS', 'NUM_CLASSES_PER', 
 				'MEAN_NUM_DATA_PTS_PER_CLIENT', 'STD_DEV_NUM_DATA_PTS_PER_CLIENT', 'PERCENT_DATA_IID', 
 				'PERCENT_CLIENTS_IID','MAX_THREADS'])
-			writer.writerow([self.COHORT_SIZE, self.NUM_EPOCHS, self.BATCH_SIZE, self.SHUFFLE_BUFFER,
+			writer.writerow([self.COHORT_SIZE, self.NUM_EPOCHS, self.BATCH_SIZE, self.SHUFFLE_SEED,
 				self.LR, self.TARGET, self.TEST_PERIOD, self.CLIENTS, self.SHARDS,
 				self.NUMDATAPTS_MEAN, self.NUMDATAPTS_STDEV, self.PERCENT_DATA_IID,
 				self.PERCENT_CLIENTS_IID, self.MAX_FANOUT])
@@ -155,7 +155,7 @@ def load_data(self):
 
 		# create sample batch for Keras model wrapper
 		# note: sample batch is different data type than dataset used in iterative process
-		self.sample_batch = tf.nest.map_structure(lambda x: x.numpy(), iter(dataset.repeat(self.NUM_EPOCHS).batch(self.BATCH_SIZE).shuffle(self.SHUFFLE_BUFFER)).next())
+		self.sample_batch = tf.nest.map_structure(lambda x: x.numpy(), iter(dataset.repeat(self.NUM_EPOCHS).batch(self.BATCH_SIZE).shuffle(60000, seed = self.SHUFFLE_SEED, reshuffle_each_iteration=True)).next())
 
 		return (x_train, y_train)
 
@@ -180,7 +180,7 @@ def train(self, test, batch, schema_num):
 
 		# preprocess test dataset
 		testset = tf.data.Dataset.from_tensor_slices((x_test, y_test))
-		processed_testset = testset.batch(self.BATCH_SIZE).shuffle(self.SHUFFLE_BUFFER)
+		processed_testset = testset.batch(self.BATCH_SIZE).shuffle(60000, seed = self.SHUFFLE_SEED, reshuffle_each_iteration=True)
 		model = self.create_compiled_keras_model()
 
 		# print(model.count_params())
diff --git a/test_tff.sh b/test_tff.sh
@@ -1,8 +1,8 @@
 #!/bin/bash
 
 #SBATCH --job-name=tff_partition
-#SBATCH --nodes=4
-#SBATCH --cpus-per-task=10
+#SBATCH --nodes=1
+#SBATCH --cpus-per-task=6
 #SBATCH --mem-per-cpu=8g
 #SBATCH --time=48:00:00
 #SBATCH --account=tewaria1
@@ -11,7 +11,7 @@
 #SBATCH --mail-type=END
 #SBATCH --output=results/tff.%A.%a.out
 
-#SBATCH --array=1-336
+#SBATCH --array=1-2250
 
 module load python3.7-anaconda
 module load cudnn/10.0-v7.6